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aGATTTACCT GTTGTCGCAC ATAACGCGGC ATTTGATATG AACGTCTTAC ATCAAAGO^T 900 

TCAAAATATT GGTTTACCAA CTCCAAATTT AACTTACTTT TGTAGTTATC AACTTGCTAA 960 

AAGAACCGTT GATTCX5TATC GATACGGTTT AAAACATATG ATGGAGTTTT ATCAATTAGA 1020 

TTTTCATGGT CATCATGATG CATTGAATGA TGCCAAAGCA TGCGCAATGA TTACTTTTAG 1080 

GCTACTGAAA AATTATGAAA ATTTAACATA TGTAACTAAT ATTTATGGTA AAAATCTAAA 1140 

AGATAAAGGC TAGGACTAAA TAAAATACTC CCTTCAAAAG TAAGCATTGT AAAAATGTAA 1200 

ACTTTGCAGG GAGCTTTATT TTATATAAAG TCATATATCG TCATATTTTr ATAAGTTGAT 1260 

TGTTCTAAAT TACCTACAGT GACACCAATA AGTCGAATTG GTACATCAGG GTCTTTTAAA 1320 

TCGTTATAAA GTAAATATGC AATATTATAA ATATCTTCTT CAGAACTAAC CGAATCTCTT 13 BO 

AAACTCATCT GTTTAGATAG CGTTTCAAAT TGATAAGTTT TAATTTTAAC CGTTACAGTT 1440 

TTAGCTGACT TCTGTAATTT ATTTAGACGT TCAGCTGTTT TACCTGxiACA ATTCCCATAC 1500 

TTTTCTTAAA ATCTCTTCAT CATCATTCAC GTCTGTTGCA AATGTGCGTT CAGTCCCTAC 15S0 

TGATTTTCTT ACTCTTGATG ATTTCACTTC ACTATGGTCA ATACCGCGTG CCTTGTTATA 1620 

25 TAAACCCCGA CCTCTTTTTC CAAACAAACG TATTAATTCA AATTCCGTTT TCTCATATAA 1680 

ATCTCTACCG TTAAAAATAC CATTATCATG CATTACTTTT TTGGAAGCTT TACCTACGCC 1740 

TGGaAAATCT CCAATATCCA ATGTCATCAA AATATCATGG aCATTTTGAT AATCAATCAC 1800 

AGTCATACCA TCAGGTTTAT TCATACCACT CGCTAATTTA GCTAAAAATT TGTTATAAGA 1860 

AACACCTGCA GATGCTGTTA AATGTGTCTG CTCTAGAATA TCTTTTCTAA TATACTGAGC 1920 

AATTTTCGAA GCAGGAAGGT CTGGTCTCAC TAATTCTGTA ATATCTAAAT ACGCTTCATC 1930 

CAATGACATC GGTTCTACCT TATCTGTATA ACTTCGGAAA ATAGACATAA TCTGCGCAGA 2040 

TGTTTCTCGG TAAGCACCAA AATTACTTGT GACAAAGTAT CCATTTGGAC ATAATTTATG 2100 

CGCTTGTGAC ATAGGCATTG CTGAATGGAC GCCGTATTTT CGTGCTTCAT AGGATGCCGT 2160 

AGAGACAACA CCCCTACTGC TTGCTTTACC ACOW^CAATG ACTGGTTTCC CTTTCAATTT 2220 

GGGGTTATCT CTCATTTCGA CTTGTGCAAA AAAATAGTCC ATATCTATAT GAATAATTCG 2230 

45 TCTCTCAGTC AAGTGCTCAC CTCCCTACTA ATTTTTACTT TTATAACGCA CAAAAATATC 2340 

TCAACATAAT TATACGCTGT GTACGATTTT TTTACATAAA TCTTGCACTT AGCGATAACT 24 00 

ATATTGaGAT AACTACAAGT TGTTATaAAA TCAATTGCTA TTTAAGCATG ATGATGAAGA 24 60 

SO CGATTGAGTA AGAAAACATA GGTAATCTGA AATAATTCAA GCAAATTCAT TTTGTTGGTA 2520 

TCATCATATT AAAATTTATT ATTGAGTCGG CTTTTGATGA TACAAATAAA TACTATCTTC 2580 
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AAAGCAATAA GCGGTATGCA TACTAAACAT AAAAATAAGT GATGAATAAC CAAATACCTT 2700 

AATTAAAATA AGCAAGCCAG TACTTAATAG GATTAGTGGT GACAGCATAA TAATTGAGAA 2 7 SO 

TTGCCATTTG TTGAAGCAAG CATCTGCTGT TTGGAATAAG ATTCTGTCTT TTTTTATATT 2820 

AAACATAGGT TTGCTATCTT TTTTAAATAA AAGAAATAAT GCTCTATGGA TAAGTTCATG 2880 

TAAAATCAAT AAAATAATGA ATCCAGCAAA CCCATATACA AGATTGATGA TGATATTTTG 2940 
ATCGACAACC GCTGTGACAC CTAACGCCCA CTTATACGTA AATAAAATCA CGAATAACGC - 3000 

AATAACAAGT TGCAAGATAA TAAACCTTCG CATTTGAAAA TTATTTGTCG TTAAATCAAT 3060 

TTTATGCATT ACCAACCCTC CCGATCATGA CATTCTTATT CTTCTTTAAA TATAGTATAC 3120 

AATGTCACAT TTAATTTAAA AAGTTCATAT CAAGAAAGTA AATTGGCTGT AATAAAATTT 3180 

TAATATACGA CTTCTTTCTT CACTTATTAA GGCGAAATTT TATCtCAAAT CATGTGCGCT 3240 

20 ATTTCAAATT GAATAATGCC ACTGTCTCAA CATGTGTTGT TTGTGGAAAC ATATCTACCG 3300 

GTGTTACCTC TTCAAGTTGA TATTTTTCAG CTAATAATAA TGCATCACGT TGCTGTGTTG 3360 

CGGGATTACA TGAAATATAG ACAATACGCT TAGGTTCTAA TGTAAGCAAA GTCTGAATAA 3420 

25 ACGTTTCGTC ACAGCCCTTT CTTGGCGGAT CAACCATTAC AACATCTGGT TTAATCCCTT 34 80 

GTGCTTTCCA TTGTAAAATA ACTTCTTCAG CTTTCCCACA GACAAAAGTT GTATTATTGC 3540 

ATTGGTTTAT AGTCGCATTT TGTTGTGCGT CTTCAATTGC AGAAGGTACT ACTTCAACAC 3600 

CGTATACATG TTTTGCAAGT GGTGCCATAT ATAGCCCTAT TGTTCCAATA CCACAATAGG 3660 

TATCTAATAC AACTTCATTA CCTGTCAATT GCGCATACTC AATTGCTTTA TTATATAATT 3720- 

TCTCTGTTTG TTCAGAATTA ATTTGGTAGA ATGACTGATC ACTTATTTTA AATGTACTAT 3780 

CTGTTAATTG ATCAATAATT GTATCTTTAC CATATAGCGT TATAGATTGA CGTCCCATAA 3840 

TAACATTAGA GTGGCTATCA TTAATGTTTT GTTTAATGCT TGTCACATTA GGAAATGCAT 3900 

CTAATATCTT CTCAACAACA GCATTTTTTT GTGGCCACTT TTTACCATTA GTTACAAAAA 396 0 

TAATCATCAT TTCGTCTGTA TGATATCCTG TTCTTACAAC CAAATGTCTC ATTAAACCTT 4020 

TTTTCAATTG TTCTTGATAA ATACTTACAT TTAAATCTTT TAAAATAGAT TTAACTTCAT 4080 

4S TCATCACTTC TTGATGTTGT GAATCTTGTA TTAAACAACT TTCCATGTCA ATAATGTCAT 4140 

GGCTTCTTTG ACGATAAAAG CCCATAATAA CTTCATTCTG TTCATTCTTA CCAACTGGAA 4200 

TCTGGGACTT GTTTCGATAT CTCCAAGGAT CTGTCATGCC AACTGTATCG TTAATCTTAG 42 6 Q 

AATTATCAAA ATGCGCTTTT CGCTGAAACA AATTAATCAC TTGTTCCTTT TTCATTTCAA 4320 

GTTGTGCTTC GTATGATAAG TGTTGAAGTT GGCACCCACC ACAACGTTCA TAATATATAC 4380 
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AGTTCTTTTT TACTTTGATA ATTTTATATT CAATTTGTTC ATTAATTAAA GCTTGTGGTA 4500 

TGAAAATAGG AAAGCGATCT ATTTTTACGA CACCATGGCC TTCATGCGTT AAATCAACAA 4560 

5 CTGTTCCCGT TTTTATGTCA TTTTTAGCTA TTGCTTGCAA AATTXTACCT CCAAAATGAA 4 620 

CAGGTTAGGA ACAAAATTAT GCGCTTCCTA ACCTGCCATT ATATATTTCA CTATTTCTGT 4S80 

TTATTCTTCG ATTAAATTGT CATCAACATG ATCATTATTT ATTAACTCTT CATTTACAAT 4740 

ATCATTAGGT GCAAAGACAT CTATATGACG TTCTAGATTT AAGAAATTCG CTGGTAATTT 4800 

ACCACCATAT TCTCCATCTA CATTTAGTTG TAAGTCTGTG AATGATGAAA TATTAATTGC 4860 

CTTTGCTTTT TCATAAATAA CTTTAGGATG CTTAGTATGT TCTCCTCTTG AAGCTAAAGT 4 920 

15 

CATAATATGA CCAAGTTCTG CAAGGTTTGA TTTTTCAACT ATAATTAACG TAAAATAGCC 4980 

GTCATCTAAC TTAGCGTCCG GCACTAATTT TTCAAATCCT GCCATTGAAT TTGTTAAACC 5040 

TAAAAAGAAT AATAATGCTT CTCCTTGGAA AACATTACCA TCATATTCAA TTCTTAAATC 5100 

20 

TACAGCTTTC ATTTGAGGTA ACATTTCGAA ACCTTTGaXG TAATAAGCAA ATGGACCAAC 5160 

AATAGATTTC AATTTACTCG GTGTTTCATA AGAGACTTGC GTCAATTGTC CGCCTGCAGC 5220 

25 TAAATTAATA AAGTATCGAT TATTCATTTT ACCAATATCT ACTTTAGTAG AATGACCTTC 5230 

AATGATGACA TCAAGTGCCC CCATGATGTC ATTAGGTATA TGCAATGCAC GTCCAAAGTC 534 0 

ATTAACAGTA CCCATAGGAA TGACACCTAG CTTAGGACGA TTAGGCTTTT CTGCGATACC 5400 

ATTAACTACT TCATTTAATG TTCCATCACC ACCTGCAGCG ATTAATACAT CATAATTTTC 5460 

ATGCATAGCT CTTTCTGCTT CAAGTGTGGC ATCACCTATT TTCTCGGTTG CATATGCACT 5520 

CGTTTCATAT CCCGCTTTTT CTAATTTTAT TAAGGCATCA GGTAATTCTC TTTTAAATAG 5580 

35 

CTCTTTACCT GATGTCGGGT TATAAATGAT TCTAGCACGT TTCCTCATAT CTTATCCCTC 5640 

TAOTAAAAT TCATATATTT TAACTTCATC TTTGTTTCGT CTAATAGGGA GTGGGACAGA 5700 

AATAATATTT AACAAAATTT ATTTCGTTCT ACCCCAACTT GCATTGTCTG TAGAATTTCC 5760 

40 

TTTCGAAATT CTCTATGTTG GGGCCCCACC CCAACTTGCA CATTATTGtA AGcTGACAGA 582 0 

AAGTCAGCTT CTTTGTTTGG GGGCCCCGCC AACTTGCACA TTATTGTAAG CTGACAGAAA 5880 

ATCAGCTTCT ATGTTGGGGC CCCACTAGAA TTGAAAAAAG CTTGTTACAA GCGTATTTTC 5940 

45 

TTTCAGTCAA CTACAGCCAA TATAACATTG TAGTGCCTAG GACATTGAAT TTATGACCCA 6000 

GGCTCAGTCT TATTTCATCA TTCTTAATAT CGTTAAAGAC CAACTTGTAT CTTAAACAAA €060 

50 TACTATCTCA ATATGTACAA AGCTTGTTAT TTATTCAGCA TTTTTTGCCG TTCTTCATTA 6120 

TAtAGcTTCG TCAGTTATGC TATTTTACCT TTAAAATGAT GTTGTAAATA TAATGTTGTC 6180 

55 



779 . <? 



EP 0 786 519 A2 



10 



IS 



AACGCATTAA TAAAATTAAT ATTTTTACCA TTAACATGTA CAATGAATAA AGTTAAAAGT 6300 

AATTTGACTT CTATAGATAT AAATAAACCC TCGATTGCAT CTAAGTCAGC AATCAAGGGT 6360 

TTATTTTTTA AATCTTCATA GTTTGATGAT TTAAATTATC TTTTATCTAA TTCTTGTTTT 6420 

AATAGTTGAT TTACTAATTG TGGATTAGCT TGACCTTTAG ACGCTTTCAT AATTTGACCA 6480 

ACTAAGAAGC CCATAGCTTT GCCTTTACCA TTTTTGTAAT CTTCAACTGA TTGTTCGTTA 6540 

TTGTCTAATG CTTCATTTAC AAATTTTAGA AGTGTTGCTT CATCAGAAAT TTGAACTAAG 6600 

CCATTATCTT CCATAATCTG TTTAGCATTA CCACCTTTAG CTGCTAACTC TGGGAAGACT 6660 

TTCTTCGCAA TTTTACTGCT CATTGTTCCG TCTTCGATAA GTTTAATCAT ACCTGCTAAA 6720 

TTTTCTGGTG TTAATTTAGT ATCTAATAAT TCTACTTGAT TTTTATTTAA ATATTCGTTT 6780 

ACGCCACCCA TTAACCAGTT AGATGTTAAT TTAACATCTG CACCGTGTTC AATTGTTGAT 6840 

20 TCAAAGAAAT CTGACATTXC TTTAGTCAAT GTTAATACGT GTGCATCGTA TGCAGGTAAA 6900 

CCTAATTCAT TTACATACTT AGCTTTACGT TCATCTGGTA ATTCAGGAAT TGTCTGACGA .6 960 

ACACGCTCTT TCCAAGCATC ATCAATATAT AAAGGTACAA TGTCAGGCTC TGGGAAGTAA 7020 

25 CGGTAATCAT CAGAACCTTC TTTAACACGC ATTAAAATTG TTTTACCTGT AGATTCATCA 7080 

AATCGACGTG TTTCTTGTCC GATTTCTCCA CCATTTAACA ATTCTTCTTC TTGGCGTTTT 7140 

TCTTCATATT CTAAACCTTT ACGTACATAG TTAAATGAGT TTAAGTTTTT CAATTCX5GCT 7200 

ITAGTACCAA ATTTTTCTTG ACCATATGGA CGTAAAGAGA TGTTAGCATC ACAACGTAAA 7260 

GATCCCTCTT CCATCTTAAC GTCTGATACA CCAGTGTATT GAATAATTGA ACGCAATTTT 7320 

TCTAAATATG CATATGCTTC TTTAGGTGAA CGAATATCTG GTTCAGATAC GATTTCAATT 7380 

AGCGGTGTAC CTTGACGGTT CAAGTCAACT AATGAATACT CACCTTTATG TGTTGACTTA 7440 

CCAGCATCTT CTTCCATGTG AAGACGAGTA ATACCGATTC GTTTTGTTTC ACCGTCGACT 7500 

TCGATATCGA TATATCCATT TTCACCAATT GGTTGATCAA ATTGAGAAAT TTGATATGCT 7560 

TTTGGATTAT CTGGATAGAA ATAGTTCTTA CGGTCAAACT TAGATTCTGT TGCGATTTCC 7620 

ATATTTAGTG CCATTGCAGC ACGCATTGCC CAGTCTACTG CACGCTTATT AACAACTGGT 7680 

45 AAGACACCTG GATATGCTAA GTCGATAACA TTTGTATTTG AGTTAGGTTC TGCTCCAAAA 7740 

TCCGCTGGTG ATGGAGAAAA CATTTTTGAG TCCGTTTTTA ACTCTACGTG AACTTCAAGT 7300 

CCTATAACTG TTTCAAAATG CATGATTTCC ACTCCTTATA ATTTTTCATA AACGTCATGT 7860 

AAATTGTATT GTGTTTCATA TTGATAAGCG ACACGATATA ACGTTTTTTC ATCGAATGGT 7920 

TTACCAATGA ACTGTAAACC GATTGGTCGG CCATTTGATT GTCCACAAGG AACAGAAATA 7980 
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GGATCATCAA TTTCTTCACC TAAATTAAAC GCaGTgTnAG GCGCTGTTGG ACCAACTACT 8100 

ACATCATAAT TTTCGAATAC TTTATCAAAG TCATTTTTAA TCAATGTTCT AACTTTTTGA 8160 

GATTTTTTAT AGTAAGCATC ATAGTAACCT GAACTTAATG CAAATGTACC TAAGAAAATA 8220 

CGACGTTTTA CTTCTTTACC GAAACCTTCA GATCTTGACA TTTTATATAA TTCTTCTAAT 8280 

GAATGAGCTT CTTTAGAATG ATAACCATAA CGAATTCCXST CAAAACGAGA AAGGTTTGAC 8340 

GAAGCTTCTG ATGATGCAAT CACGTAATAT GATGGAATAC CAAATTTAGT ATTTGGCAAT 8400 

GATACTTCCT CAACGACAGC ACCTAAAGAT TTTAAAGnT CTACAGCGTT TTGAACTGCT 84 60 

TCTTTTACGT CATCAGCTAC ACCTTCACCT AAGTATTCTT TAGGTAATGC AACTTTTAAT 3520 

CCTTTAATAT CTTTACCAAT TTCAGATGTA AAGTCTACAT CATCAACTGG TGCACTTGTA 8580 

GAGTCATTAA CATCTGCACC AGAAATAGCT TCTAATACGA TTGCATTATC TTTTACATTT 8640 

20 CGAGTCAATG GACCAATTTG GTCTAATGAA GATGCAAAAG CAACTAATCC AAATCGAGAT 8700 

ACACGACCGT ATGTTGGTTT CATACCGACA ACGCCACAAT ATGCAGCCGG TTGTCTAATT 8760 

GAACCACCTG TGTCTGAACC TAAGCTAAAT GGTACTAAGC CAGCTGCAAc TGCTGCTGCA 3820 

2S GATCCACCTG ATGAACCACC TGGCACTGCT TTATGGTCAA ATGGGTTAAC TGTTTTTTTG 8830 

AAATAAGATG TTTCTGTTGA ACCACCCATT GCAAACTCAT CCATATTTAA TTTACCGATT 8940 

AAAACGGCAT TTTCATTATG TAGTTTTTCC ATTACAGTAG ATTCGTAAAT TGGCACAAAA 9000 

CCTTCTAACA TTTTACTTGC ACATGTTGTT TCTAATCCGT TTGTAATAAT GTTATCTTTT 9060 

ATACCCATTG GAATACCAAA TAATTTGCCA TCCATTTGAT CTTTTGCTTG TAATTCATCC 9120 

AATTCTTGCG CTTTTTTGA7 TGCATTTTCT TTATCCAGCX; CTAGAAAAGA CTTAATTGTT 9180 

GGATCAGTCT CTTCAATTGC ATCATATATA TCTTTAACAA CATCAGATGG TTTGATTTTT 9240 

TTGTCTTTTA TTAAAGTTAA TAAATTCTCA ACCGATTCGT AGCGAATGCT CATCTTACGC 9300 

GTCCTCCTCA TTCATGATTG TAGGCACTTT AAATTGTCCA TCTTCTGTTT CTTTGGCATT 9360 

TTTCAAAGCT AATTCTTGTG GAATACCTTT AATTGCTTTA TCTTCACGTA AAACGTTTTG 9420 

TAAATCTAAA ACGTGATATG TAGGTTCAAC GCCTTCTGTA TCAGCGCTAT CATTTTGTTT 9480 

45 TGCAAAATCT AAAATGCTTT CTAATGTGTT GGCCATTTCT TCCGTTTCTT CAGGAGAAAT 9540 

TTGAAGTCTT GCAAGATTCG CGATATGCTC AACTTCTTCA CGTGTTACTT TTGTCATTAA 9600 

TAAAAGCCTC CTTTAAGTCA TTCATCACTA AATTGTATCA AATTTCCAAT TAAAAATCTA 9660 

50 AGTATTTATG AGGTGCTACT TTAATTTCA7 ATAAACTGTA TAAACATTAT CATTCGTTTA 9720 

TCAAATCATT TTTTATGAAA ACAACACTCT TTTAATATTA GACAACCCAA TTCAATATTA 9780 
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TATATTGGTA TGCAAGTATT TCAAAAAGAA TAAATTTAAT TTTCCTACTT TTCTAAACAT 9900 

TTATCTTTAT GTATAATGTT TTCAAGTAAC TAAATTATAA ATTAAATAAA GGGAGTGTTT 9960 

ATCATGC1TA CAATGGGGAC AGCATTAAGT CAACAAGTAG ATGCCAATTG GCAAACTTAT 10020 

ATTATGATTG CCGTCTACTT CTTGATACTA ATCGTTATTG GCTTTTACGG TTACAAGCAA 10080 

GCAACTGGTA ACCTAAGCGA GTACATGTTA GGTGGACGTA tATTGGACCG TATATTACTG 10140 

CATTATCAGC TGGAGCTTCA GATATGAGTG GATGGATGAT TATGGGGCTA CCTGGTTCTG 10200 

TCTA7AGCAC TGGTCTATCA GCTATGTGGA TTACAATCGG TTTAACATTA GGTGCTTATA 10260 

TAAATTACTT TGTTGTTGCT CCTAGACTTC GTGTTTATAC CGAATTAGCT GGAGATGCAA 10320 

TTACATTACC AGATTTCTTT AAAAATCGTT TAAACGATAA AAATAATGTG TTAAAGATTA 10380 

TTTCTGGATT GATTATOGTA GTATTCTTTA CATTATATAC ACATTCTGGT TTCGTATCTG 10440 

GTGGTAAACT ATTTGAAAGT GCTTTTGGAT TAGATTATCA TTTCGGTTTA ATATTAGTTG 10500 

CTTTCATTGT CATTTTCTAT ACTTTCTTTG GTGGATATTT AGCTGTATCA ATTACAGATT 105S0 

TCTTCauVGG TGTCATTATG TTAATTGCGA TGGTTATGGT CCCTATTGTT GCTATGATGA 10620 

ATTTAAACGG CTGGGGAACG TTTCATGATG TAGCAGCTAT GAAACCTACA AATTTAAATT 10680 

TATTTAAAGG GTTATCATTT ATAGGAATTA TCTCTCTATT TTCATGGGGA TTAGGTTATT 1074Q 

TCGGTCAACC TCATATCATT GTAAGGTTTA TGTCTATTAA ATCACACAAG ATGCTACCTA 10800 

AAGCTAGACG TTTAGGTATT AGCTGGATGG CTGTTGGTTT ATTAGGCGCT GTGGCTGTTG 10860 

GTTTAACAGG TATTGCATTC GTACCTGCTT ATCATATTAA ACTAGAAGAT CCTGAGACAT 10920 

TATTCATCGT GATGAGTCAA GTACTCTTCC ATCCTCTTGT AGGTGGTTTC TTACTTGCTG 10980 

CGATTCTAGC TGCAATTATG AGCACGATTT CTTCACAATT ACTTGTAACA TCTAGTTCAC 11040 

TAACGGAAGA CTTTTATAAA TTAATTCGTG GTGAAGAAAA AGCTAAAACG CACCAAAAAG 11100 

AATTTGTTAT GATTGGAAGA TTATCTGTAT TAGTTGTAGC AATTGTTGCC ATCGCGATTG 11160 

CATGGAATCC AAACGACACA ATTCTAAACT TAGTAGGTAA CGCTTGGGCC GGATTTGGTG 11220 

CATCGTTCAG TCCACTTGTG CTATTTGCAC TTTACTGGAA AGGTTTGACA CGTGCCGGTG 11280 

CTGTAAGTGG AATGGTTTCA GGTGCCTTAG TCX5TTATCGT TTGGATTGCA TGGATTAAAC 11340 

CATTGGCACA TATCAACGAA ATATTCGGCT TATATGAAAT TATTCCTGGA TTTATTGTAA 11400 

GTGTAATCGT TACATATGTT GTAAGTAAAC TTACTAAAAA ACCTGGTGCA TTTGTTGAAA 11460 

CTGACTTAAA CAAAGTTCGT GACATCGTTA GAGAAAAATA ATTCATAAGT CTTAACAAAT 11520 

TAAAAAGGTA CTAATGTTAA TCAAAATTAT GACTAACATT GGTACCTTTT TATTATCTTT 11580 
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AATTAAAGCA CGTGGTTGGT TACCATCTTT AATACGAATT TCATAGTTAT CGATTTTATC 11700 

GAAATATTTA TTCGCTTGTT CAGTAACGTA CTG7GTAATA CCAATTGTTT CAGCTTGTCC- - 11760 

ATAGTAATCG ATTGGTAAAT CTACTACTAA TCGTTGTGGC TTTTTATCAA CAAATTTAAC 11820 

TTTCCCTACT GCTTGTGTGA AATTAGAAAA ATATGATTGC AAATTATCAT TAAATTGCTT 11880 

GAAATTATTA TTTAAATTTT CATCATAATC TGCTGCTGTT GAAGAAGGTA ATAAAGCTGA 11940 

TTTTTCATTG ATATTATGCC ATTCATTAAG CTTTGTTTGA CTCTTTTCTG CAGTCGCTTG 12000 

AGTGATAAAT TCACCTGGTG TGATTGAATC TTCACTTGAT TGCTTATAAA TTGCAAAATG 12060 

AATTGGTATA TCTTTTAAAT CATCATTTTC ACGTAACCTT GATAATATCT CACTAGCCAT 12120 

TTGTTTACCT TGCTTTTTAA CTcGCTATCA TCTAGTTTTT TACTAAAAGT CGATCCATCT 12180 

TTTTCTTTTT TATAGTAATA AACACTATTC ATAGCTAAAC CAATCGTCAT ACCTTTAATA 12240 

TTCTTACCTT TTGTATCTCC ACCACCATAA AAATCTTGCT CTAAAATGTT AGATAAATAG 12300 

GCTGGTGATT TTTCTGCAAT CTTTTCAGGA TCTGTTTCAC CTtCGTGTGA TGGATTAAGT 12360 

CCTAAATTTT CATTCGCTTT CTTGTCTTTT TTATCTmT CAGACATTTT ATCGATTTCA 12420 

CGTTTTGTAT ACTTAGGATT TAAATAGGCA TTAATT6TTT TCTTGTCCAA AAATTGACCA 12480 

TCTTGATACA AATATTTATC TGTTGGAAAT ACTTCTTTAC TTAAGTTCAA TAAACCATCT 12540 

TCAAAGTCGC CGCCATTATA ACTATTTGCC ATGTTATCTT GTAAAAGTCC TCTTGCCTGG 12600 

CTTTCTTTAA ATGGTAACAA TGTACGATAG TTATCACCTT GTACATTTTT ATCCGTTGCA 12660 

ATTTCTTTTA CTTGATTTGA ACTATTGTTA TGTTTTTGAT TATCTTTTCC AGCCTGGTCA 12720 

TCCTTATGGT TACCACAAGC AGCGAGTATA AAGATAGCTG TAATCAATAA TACTAATGTA 12780 

CGCTTCATCG ACATACCCCT CTAACTATTT AATTCATTTT GCTTATCTAC AAATTGTTGC 12840 

TCTGTCCAAA TTTCAATACC TAAACTTTGT GCTTTTGTTA ATTTTGAACC TGCATCTTCA 12900 

CCAGCAATAA CGACATCTGT ATTTTTAGTA ACGCTACTTG TAACTTTAGC ACCTTGTGAT 12960 

GCAAGCCATT TAGATGCTTC ATTGCGTGTC ATTTGATGTA GCTTACCAGT CAGTACTATC 13020 

GTTTTACCAC TAAATTCAGG ATGTCCTTCA ATATCTGATG TTTTGATACC TTTATAAATC 13080 

ATATTAACAT GTTTATCTTT TAATTTTTGA ATTAAAGCAC GAATATCTTC ATTTTCTAAA 13140 

TAAGTAACTA CAGATTGTGC TACTTTATCA CCTATATCAT GAATTTCTAC TAATTCCGCT 13200 

TCAGTTACCG TTAGTAATCG. ATCTATCGTT TCATATTTTT CTGCTAACAC TTGGCTCGCT 13260 

TTAACACCTA AATGCCTAAT ACCTAGACCA AATAATAAAT TTTCTAAAGA GTTGTCCTTA 13320 

GCTTGTTGAA TGGCAGCTAA" TAAATTATCA ACTTTTTTCT GCCCCATTCT GTCTAAAGGT - 13380 
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TAAAGCTGTT GAATAATTTT AGTGCCTAAA CCATCAATAT TcATGGCTTG TCTTGaTACA 
AAGTGnATCa ATCCtTcAAC AAGTTGTGCT TGGTCATTTT GG 
(2) INFORMATION FOR SEQ ID NO: 155: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 18 93 base pairs 
(3) TYPE: nucleic acid 

(C) STRANDEDNESS ; double 

(D) TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: ISS: 
CAGTAAACAC CTCTGATTAC GAATATTTAT ACATTTATTT TAACACATGC ACTGATTTAC 
GACTACTAAA CACCTTTACG TAAAAAGGCT AAACATGGTT TATCTATCTT GGTTATCTAT 
TTATAAATAT TTuTCATATT ACGCATAACA ATTGCTTAAA ATATGTATAA AAATGAATAT 
ATGTGTAATA AACTTGCTAA TTATTAGATT TAATAAGCGT CAATTGTTTG AACATATTtA 
ATTAAAATCA CATTGATATC ACAGATACGA ATATTGTCGT ATAGAAATTG AAAATTCTAT 
TTTTTAAATG AAAGTCTTCA ACATAATTTT AAGTTTCAAC ATGAGAAAAA TCGATTAACA 
AACAACGTCA GTTGAATATG CCTTTTGAGA CATTTCAAAC TTTACAATTG TTGCTAATCG 
ATATATTTGC TTTTAGTGAT CCCTGCTATA AAATAAATCA ACGATTTCTA ATAAGTGTTT 
TGTATTCAAT TGTTCATCAA TTTGCGTTAG TTCATCCACT GCTGCGTCTC TATGATAAGT 
CAATTTATCT TCTGCGCCAT CTTTCCCTAA TAAACTCACG TACGTACTTT TATTATTTTC 
AAGATCGCTG CCCACTTTTT TACCTAACTT TGCTTCATCA CCATAGCAGT CTAATAAATC 
ATCTTTAATC TGGAACATCA TACCTAAATG ATAACTATAA CTTTCTAAAT GTTCTTTAGT 
TGT^CATCG ACATTAGCGA TATCTGCTGC ACTCATAACC GCAAAAGTTA ATAATGCTCC 
TGTTTTTGTT TTGTGTATCA TTTCCAAAGT TTCAAGATCA ATTGGTTGGC CTTCGCTTTG 
CATATCTAAC ATTTGACCGC CGACCATTCC AACATGACCA CTTGCTATTG ACAGCCGTTG 
TAGAACTTTT ATTTTTACTT CATCAGTTAA TCTATCATCA CTTGAAATAA GTTCAAATGC 
TTTAGTTAAT AAAGCATCAC CTGCTAATAT CGCAGTCCAC TCACCATATA CTTTATGATT 
TGTTAATTTT CCTCGTCGAT AATCATCATT ATCCATCGCT GGTAGGTCAT CATGAATAAG 
TGAATATGTA TGAATCATTT • .CTAGTGCAAT TGCGCTCTTC ATACCTAACT CATACTCGGT 
SO ATTTAGTGAA TCTAAAGTGA GTAATAACAG AACTGGTCGG ATGCGTTTAC CTCCAGCATT 

TAATGAATAC AACATACTTT CTTCTAGCTG AGTATCCATT ACTGATTTAT TTATCGCAAC 



45 



60 
120 
180 
240 

300 
360 
420 
480 
540 
600 
660 
720 
780 
840 
900 
960 
1020 
1080 
1140 
1200 
1260 
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CATCCTCAGC rrCTTCTTTT ATTAAGTCAT TCACCTTTTT TTCGGCATTT TTTAAAGTTG 1380 

TGTCACAAGC TGCTGATAGT TTCATACCAC GTTGATATAA ATCTAATGAT TCCTCTAAAG 1440 

* ATACTGTTTC ATTATCTAAT TTTTGAACAA TTTGCTCTAA TTCTTGCATC ATTTCTTCAA 1500 

AACTTTGCGT TTCTTTAGTC ATTATTACAC CTTACTTTCG TAACTTTTGC ATCTACTAAG 1560 

CCATCTTTCA TTGTTAACGT CAATTGATCA TTTTCTGTTA AATCTTTAGT ACTCGTAATG 1620 

10 

ACTTCGTCTT TTTTATTAAC AATTGCATAT CCACGCAACA TTGTATTAGT TGGACTTAAA 1680 

TTGTTTAAGT TTTCTACTTT ATTTTTCAAA TCATTTTTAT AACTTAATAT CTTAGAATTC 1740 

AATAATTTAA CAAGTTGGTT TGTCAATTGA AGATTATnTT GTTGTTCTTG ATTAACACTA 1800 

75 

CTTAGTAATG CTTTTAAATn ATAACGTTGG TGCAACAGCA TTAAATCGAG GCCCCGGTGG i860 

TCCAAAGTTG CCCGAATTnG TGGTTTCAGG CCC 1893 
2^ (2) INFORMATION FOR SEQ ID NO: 156: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 821 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : doilble 

25 (D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 156: 

AAAATATATT CCTTCACTTA ATATTCAATT AGAGAAAAAC ATGGTGATTG TAATATGTTG 60 

TGCAATATTT CTGGGTGTTT TAATACTTTT TTTATTTCTG AATCGTAAGC TAAGGTTGGA 120 

AATTTATAAT AATAACTCTA GTAAAGGGAA AATAATTTTA TTTCCTTCAT TAAAAAACTT 180 

35 

TTGTTTCACA ATATTTTATT ATTTTTTATT TGGCGGTCTT TCAATAATGG CTCTAAGTAT 240 

GTTATTAACT TTAAATCCTC AAAATATAAT AGGCTTTATT GGTTGGTTGG TAATGACTGC 300 

AGGTTTCTTT CTGTTAAACA TGTCATCGAT TATTGACAAA AAAATTTATG TATTATCTAA 360 

40 

AACTAACACG GTGGAAAAAT GATGGTTTAG CTGGATTTAC TGCAGGTTCT ATTTCGGCAA 420 

TACTTGTATA TTGGACCAAT CAAAAAAATG AATTTGGAAT AAAAGATAAA AACGATTGGA 480 

TAGGACATAA ACTAGACGTT GGTATAGATG CTGTAGAAAA ATCTGCAGAA AAAACAGTAG 540 

ATGGTGTTGA AAATGTCATG GTGAAGCTTC AAAAAGTATT TCTAATCATA TAAGCCCTAA 600 

GAAATGGAGC TGGTAAATGT TGCTATGCGA ATCTAAAATC ATCAATAAAA ACCCAAAATA 660 

SO TAGAATTATT AAATATAATG ATGAATACTT AATGGTCGAT ATAATAAGCA CTTGGATTAG 72 0 

TTTATTTTTT CCTTTTATTA ATTGGTTCAT CCCaAAAGaA TACGTCAAAA TTAGTAGAGA 780 
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(2) INFORMATION FOR SEQ ID NO: 157: 
(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2343 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



10 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 157: 





AGTAAGATAA TTTTCAATTA GAAAATATCT TACTGCTGTT 


CTCTATTTAT 


ACAATACTTC 


60 




GTATTGAATG GcTTCGCTTT CCTAGGGTGC CGTCTCAGCC 


TTGGTCTTCG 


ACTGGCACTG 


120 


CTCCCTCAGG AGTCTCGCCA TTAATACTAC GTATTAACAT 


GTAATTTTAC 


TTTGAAATAC 


180 




TTTTAAAAAA TAAGACACTT TGCCCAACTT GCACATAAAT GTAAAATTCA 


ATAAAATGAA 


240 


20 


TTTTCTGTGT TGGGTCCCTT CTTATAATTT AATAAATACC 


ACTAAACTAA 


ATTAACGAGG 


300 




TGCCTTATGT ATAAAAATTA TAACATGCCC CAACTACACT 


ACCAATAGAA ACTTCTGTTA 


360 




GAATCCCTCA AAATGATATT TCACGATATG TTAATGAAAT 


TGTTGAAACr 


ATACCTGATA 


420 


25 


GCGAATTCGA TGAATTCAGA CATCATCGTG GCGCAACATC 


CTATCATCCA 


AAAATGATGT 


430 




TAAAAATCAT CTTATATGCA TATACTCAAT CTCriTAATT 


ATGTTCAAAG 


CATTAAGGTA 


540 




ACAAGACAAT ATCTAAGATA TCAAAGATAG AAATTTTTTG 


ACGTTGTTGC 


TGATTGTAAA 


600 


30 


CATAACCATC AATTTCATAA TTAATAGCAT CAATACGATA 


AATGGTTAAG 


CGTACTGAAT 


660 




CTACAAAGCC ATTATTATAA AATTTAACTT CTACAGGTTG 


GGCATATTGT 


AGCGCCTCGT 


720 


35 


GTAGCCGAAT GTTTAGCTCA GCCAATTGAT CATCTGATAA 


TACAGGACGT 


GTAATTTTGT 


780 


riTGGTCGAT AATGTATTGT TGAATCGTTT CGAATTGTTC 


GGGTAATGTT 


GCAAAAGGAG 


840 




CCCSTTTAAT CATGCCTCTT CCCATAGGTA TATTGTTATC 


TAGTAATTCT 


CTTGGAACGT 


900 


40 


TACGATAATC AGTTTCTTCT TCATAACTTG TCATCCTTAA 


TTCACCCCAA 


TCTGATAATT 


960 


ACATTATACG AACATGTGTT CTATTTTGCA ACAAAAATTT 


TGTGGaAGCA 


TAAACGCGTT 


1020 




AATAATTAAT GCTCGTGCAA GTAAAAAAGA GGGATTAATT 


AAAATCGAAT 


AATGaCATAT 


1080 


45 


CACaGCAAAT AGTTCTTTTA AAGTAGTTAA ATAGTTTTAG CTTTAAGGAA 


aTGATAAaTG 


1140 




ATTGTwAATT CTAGCTAAAA TTTAATAAAA TGAAAATAAG ACTAACATGG 


AGGGGTAAAA 


1200 




GTAATGACAA ATGGATATAT TGGTTCTTAC ACTAAAAAGA ATGGTAAAGG 


GATTTATCGT 


1260 


SO 


TTTGAATTAA ACGAAAATCA GTCACGTATT GATTTATTAG 


AAACAGGATT 


TGAATTAGAA 


1320 




GCGTCTACAT ATTTGGTGCG TAATAATGAA GTTTTATATG 


GAATCAACAA 


AGAAGGAGAA 


1380 
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TGTTTGTCTT CAAAAGCTGG TACAGGTTGT TATGTATCGA TTTCAGAAGA TAAACGATAT 1500 

TTATTTGAAG CGGTATAIGG TGCTGGCATC ATACGTATGT ATGAATTAAA TACGCACACA 1560 

^ GGTGAAATTA TACGTCTAAT TCAAGAACTT GCACATGATT TTCCAACAGG TACACATGAA 1620 

AGACAAGATC ATCCACACGC ACATTATATT AATCAAACTC CAGATGGTAA GTACGTTGCA 1630 

GTAACAGATT TAGGTGCTGA TCGTATCGTT ACTTATAAAT TTGATGACAA CGGGTTTGAA 1740 

10 

T TTT A TAAAG AATCTTTATT TAAAGATAGT GATGGGACAA GACATATTGA ATTTCATGAT 1800 

AATGGAAAAT TTGCTTATGT CGTACACGAA TTATCAAATA CTGTGAGTGT TGCAGAATAT 18 SO 

AATGACGGTA AATTTGAAGA GCTCGAGCGT CATTTAACAA TTCCTGAAAA CTTTGATGGA 1920 

75 

GATACTAAAC TTGCAGCAGT GCGTTTATCT CATGaTCAAC AATTCTTATA TGTATCTAAT 1980 

AGAGGGCATG ATAGCATTGC AATTTTTAAA GTTCTTGATA ATGGTCAACA CTTAGAACTA 2040 

GTAACAaTTA CTGAAaGTGG TGGTCAATTC CCAAGAGATT TTAATATTGC CTCATCAGAT 2100 

GACCyTTTAG TTTgTGCTCA kGaGCaAGGA GATTCAGTTG TAACTGTTTT CGAAAQAAAT 2160 

AAAGAAACAG GTAAAATTAC GCTATGTGAT AACACTCGTG TAGCATCTGA AGGTGTATGT 2220 

25 GTCATATTTT AATCTTTAAT TAATCATGAT AAAAAGAAAA CCATGTTTCC AAAAAATTTG 2280 

TGTATACCTT GAAATTTATT GnTTTCCAGn ACATCAATTA TGGGAAGCAT GGnTTATTTT 2340 

TGT 2343 
(2) INFORMATION FOR SEQ ID NO: 153: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4837 base pairs 

(B) TYPE: nucleic acid 
35 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

m 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 1S8: 

40 

AAATTGCCAG TTGGTATCGC TTCTGGTGCA GTAGTCGAAG GTTTCTTCCA AGGTATCATT 60 
CCGATTGGCT ATATCGTTAT GATGGCAGTA TTGTTATACA AAATTACTGT TGAATCTGGA 120 

^5 CAATTTTTAA CAATTCAAGA TAGTATTACA AATATTTCAC AAGACCAACG TATTCAAGTT 180 
TTACTTATTG GATTTGCATT CAACGCATTT TTAGAAGGTG CAGCAGGATT TGGTGTACCA 240 
ATTGCAATTT GTGCACTTTT ATTAACACAA TTAGGATTTA ATCCATTAAA AGCTGCGATG 300 

SO TTATGTTTAG TCGCAAATGC AGCGTCTGGT GCTTTTGGTG CGATTGGTAT CCCTGTAGGT 360 
GTTGTAGAAA CGTTGAAATT ACCTGGAGAT GTTTCAGTAT TAGGTGTTTC TCAATCAGCA 420 
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GGTrTTAGAG GTGTTAAAGA AACATTACCA GCAATTTTAG TAGTTTCAAT CACTTATACA 54 0 

CTTACTCAAG GATTATTAAC TGTATTCAGT GGACCTGAAT TAGCAGATAT TATTCCACCG $00 

" TTATTAACAA TGTTAGCATT AGCAGTATTT TCTAAAAAAT TCCAACCAAA ACACATTTAT 660 

CGTGTTAATA AAGATGAAGA AATTGAACCT GCAAAAGCAC ATTCTGCAAA AGCAGTATTA 720 

* 

CATGCATGGA GCCCATTCAT TGTATTAACA GTCATTGTAA TGATTTGGAG TGCGCCATTC 780 

rrTAAAAACT TATTCTTACC AAATGGTGCT TTATCATCAT TAGTATTTAA ATTCAACTTA 840 
CCTGGaACAA TCAGCGAAGT TACGCATAAA CCATTAGTAT TGACTTTAAA TATTATTGGA ^ 900 

CAAACAGGTA CAGCTATTTT ATTAACTATT ATTATTACAA TTTTAATGTC TAAAAAGGTT 960 

AACTTTAAAG ATGCAGGTAG ATTATTCGGC GTTACATTTA AAGAGTTGTG GTTACCAGTT 1020 

CTTACAATTT GTTTCATCTT AGCAATTTCT AAAATCACAA CTTATGGTGG TTTAAGTGCA 1080 

GCAATGGGTC AAGGTATTGC TAAAGCAGGT AATGTCTTCC CAGTTCTATC ACCAATTTTA 1140 

GGTTGGATAG GTGTGTTTAT GACAGGATCA GTTGTAAATA ACAACTCATT ATTTGCACCA 1200 

ATTCAAGCTT CTGTTGCACA ACAAATTGGA ACAAGTGGTT CACTTCTTGT ATCTGCTAAT 1260 

25 ACAGTTGGTG GTGTAGCGGC AAAATTGATT TCACCACAAT CAATTGCAAT TGCAACTGCA 1320 

GCAGTAAAAC AAGTTGGTAA GGAATCAGAA TTATTAAAAA TGACATTGAA ATACAGTGTA 13 80 

TGTTTACTAA TATTCATCTG TATTTGGACT TTCATCTTGT CATTATTATA AAAAAACGTA 1440 

30 TTTCAAAATA TAAATATACA GAAGGTGAGA TGTTTTCTAA CATCTCATCT TTTTTTTATG 1500 

GATCATTAAT GAAAGAAGTT TGACATTATA ATAATGGTAG CGCmATGT TAAAATGAAT 1560 

AGTGAGTAAT CAGCAATCAA ATTAAATTGG TTGATAGCTG TTAAGGTTTG TGGTTTTGTC 1620 

TTTGTGCTAT CGCnCATAAA GTATATAATT AAAGTAGTTT CX5TTATTATA AAATATTAAT 1680 

ATA»TAGTA GATAGTAATA GAGCATCACC ATGGGAACCT ATTGAGACAC TTATTGATTT 1740 

AAAGTGGTAT TAATATGTCG TATTTCTCGA ACGTTCCATT ATTCATTTTA AAAAGGGGGA 1500 

CTGTATTTGT TATGACAACA CAACATAGCA AAACAGATGT CATCTTAATT GGTGGCGGTA 1360 

TTATGAGTGC aCATTAGGAA CATTACTTAA AGAATTATCA CCTGAGAAAA ATATTAAAGT 1920 

GTTTGAAAAA TTAGCACAAC CTGGCGAAGA GAGTTCAAAT GTATGGAATA ATGCCGGTAC 1980 

AGGGCATTCA GCACTTTGCG AGTTGAACTA TACAAAAGAA GGTAAGGATG GCACAGTTGA 2040 

TTGTAGTAAA GCAATTAAGA TAAATGAGCA GTACCAAATT TCAAAACAGT TTTGGGCATA 2100 

50 TTTAGTTAAA ACAGGACAAT TAGATAACCC AGATCGCTTT ATTCAAGCGG TGCCACACAT 2160 

GAGTTTTGTC ATTGGCGAAG ATAATGTAGC TTTTATAAAA AGTCGTGTTG CAACGTTAAA 2220 
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• 


GGTACCGTTA 


ATGATTGAAG 


GTCGTAAGTC 


TGATGAACCA 


ATTGCTTTAA 


CTTATGATGA 


2340 




AACTGGTACa 


gATGTTAACT TTGGTGCGTT AACTGCAAAG TTATTTGATA ATTTAGAGCA 


2400 


5 


ACGTGGTGTG 


GGAATTCAAT 


ATAAGCAGAA 


TGTATTAGAC 


ATCAAGAAAC 


AGAAATCTGG 


2460 




GGTATGGCTA GTTAAAGTTA AAGATTTAGA AACTAATGAA ACGACAACAT 


ATGAATCTGA 


2520 


10- 


TTTTGTATTT 
ACAATCAAAA 


ATTGGTGCTG 
CATATTGGTG 


GCGGTGCGAG 
6TTTCCCGGT 


TTTACCATTA 


CTCCAAAAGA 


CTGGGATTAA 


2580 




AAGTGGATTA 


TTCCTGCGCr 


GTACAAATCA 


2640 




AGAAGTGATT 


GATCGTCATC 


ATGCTAAAGT 


GTACGGAAAA 


GCAGCAGTGG 


GTGCGCCACC 


2700 


IS 


AATGTCAGTG 


CCGCACTTAG 


ATACACGTTT 


TGTAGACGGC 


AAGCGTTCAT 


TGTTATTTGG 


2760 


TCCATTTGCA 


GGTTTCTCAC 


CTAAATTTTT 


AAAAACAGGT 


TCACATATGG 


ATTTAATTAA 


2820 




ATCGGTTAAA 


CCAAATAATA 


TCGTGACGAT 


GTTATCTGCA 


GGTATCAAAG 


AAATGAGTCT 


2880 


20 


TACGAAGTAT 


TTAGTGTCAC 


AATTGATGTT 


ATCTAATGAT 


GAGCGTATGG 


ATGATTTAAG 


2940 




AGTCTTTTTC 


CCAAATGCTA AAAATGAAGA 


TTGGGAAGTG 


ATTACAGCAG 


GGCAACGTGT 


3000 




CCAAGTAATC 


AAGGATACTG 


AGGATTCTAA 


AGGTAACTTA 


CAATTTGGTA 


CTGAAGTTAT 


3060 


25 


TACGXCAGAT 


GATGGCACAT 


TAGCTGCATT 


ACTTGGTGCA 


TCACCTGGTG 


CGTCAACAGC 


3120 




TGTAGATATT 


ATGTTTGATG 


TTTTACAGAG 


ATGCTATCGT 


GATGAATTCA 


AAGGATGGGA 


3180 




ACCAAAGATT 


AAAGAAATGG 


TGCCGTCATT 


TGGTTATCGC 


tTAACAGATC 


ATGAGGATTT 


3240 


30 


ATATCATAAA 


ATTAATGAAG 


AAGTAACTAA 


GTATTTACAA 


GTTAAATAAT 


AAACGAAACG 


3300 




GTAATGTCTT 


rrrrAATGTG 


ATAGACATTA 


CCGTTTTTTA 


GTGGTTAATA 


AAAATCATTT 


3360 




TAATTGTTTC 


AGTTGCTTGT 


TAATAGTGTC 


TACGTAGTTC 


TTGTTTTTAA 


AGAATTGAAT 


3420 


35 


TATCCAAATT 


AATACATAAA 


CCACAATGAA 


GATAATTGTG 


AATATGATTA 


GATAATGCAC 


3480 




TGTI^GTGGA 


AACCAACCGG 


CAAGCATTGC 


TAAAGGCAAG 


AATCCGACAT 


ACGTTGTTAT 


3540 


40 


GAAATGCATT 


ATAGTTGCTT 


TAGTAATGCT 


CCAATCTGTG 


TATTTAAAGA 


TAAAATCTCC 


3600 


AAGGAAAAAG 


ACGACGCCTA 


TGAGTAACCA 


TAAAATGATA 


GAAATCAACA 


TTACGGTAGT 


3660 




TTCTGTGAAA 


TGCGTATAAT 


ACAATATGCC 


AATAGTTGAT 


TGTGGGTTCA 


GTGGATAATA 


3720 


45 


TTTGCCGTCT 


GCAAATAACA 


TACTAAAGAA 


CAGTGAAAGG 


GACAAACCAA 


TGATTAAGCT 


3780 




AATAAATAAT 


GAGTTTTTCA 


AATTTTTCAT 


ATTGATAAGC 


GCTCCTTTAT 


AGATTTTAAA 


3840 




TAACGTCTAG 


AAGAATAGGT 


GTAGTGTGCA 


TCTTTAAGAT 


ACATACGTAT 


AAGTCCATTT 


3900 


50 


GGCTCTAATA 


ATAATTTTTC 


AATGTAATAC 


TTGTTGACGA 


TTTCTGATTT 


GGAAATGCX3A 


3960 




atgaaatgtt" 


GTGGTAACTG 


TTTTTCTAGT 


TCATAAAGTC 


GTAATTTTAG 


TTTGAA'rm' 


4020 



55 



789 



EP 0 786 519 A2 

ACATTAATGA TATGGATTTC TTTGTCTATG TATCCGACTA ATGTATGTGA TTTGTCTAAA 4140 

TCATTGACTG CATTAATAAT ACTTTGAACG TTATCATTCA TTTTAGGTGC ATGTATATCA 4200 

^ ATATAAGATT CCGTCTCATT TGCATTGATA AATAAATTGA GTTTCATCAT AGGTTAATGC 4260 

CTCCTTCAAA ATTATTAAAC CATAAATGAC CATCGATATA TTTAAATTTT GTTGAATGGT 4320 

AGAAATTAAA TGTTAAGTGG CTAGAAAGCG CTAATCAATA TAAAAGATAC CTCCTGAAAT 4380 

W 

AAAAACAGAA ATGTTTTTTC AGGAGGTAGA GATTAAAGTG AATTATTTGG CAGTGTAATA 4440 

GTAAAGGTGG TTACATACTC GTTACTTTGT GTGAATTGGA TTGTACCATG ATGCAATTCA 4500 

ATGATGGATT TTGTAATTGC AAGACCTAAA CCATTGCTAT TATCATGTTT GCTCACTTTA 4560 

15 

TAAAAACGTT CAAATAAACX5 TGCTTCAGCT TGTGGACTAA TTGGTGAACC ATCATTACTT 4620 

ATTGTGAAAA TGATA7TGTT' GTGACTATGT TGCAAAGCGA TGTCAATGGC ACCACCAACA 4680 

2Q TCTGTATACT TAATAGCATT TATTAATAAA TTACTCAATG CTTGATGTAA CAAACGTTGA 4740 

TTTCCTAGGA AATTGATGAT TCTAGGTCAG CTAAnATGAT TAACGACTTT TCATCAGCAG 4800 

CAnATTGTTC ATGTCGAATG ATATCnTTAA TGAGCTG 4837 

25 (2) INFORMATION FOR SEQ ID NO: 159: 

<i) 5EQUBKCS CHARACTERISTICS: 

(A) LENGTH: 1600 base pairs 

(B) TYPE: nucleic acid 

<C) STRANDEDNESS : double 
(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID- NO; 159: 

35 

ACAATTATTG GATTATTATC AAGCAACGTT AATGGATGAC TTCCACTTAC AACAGAAATG 60 

CCCATAGATT CTAAATCTtT TGCATGAGCA TCTTGTGATA AGTCTTTTCC ATCATTGACA 120 

GTTACATTCG CACCTAATTT ACTTAATAAT TTAGCTGCTT CATAACCACT TTTTGCCAAA 180 

40 

CCGACAACTA ATACATTTTT ATTTTCTAAC CCTGTATAAT TAAGCATCTT AATGCACTCC 240 

AATCCATAAA CCGATTAAAC CTGAAATCAG ACCAACAGCC CAAAATACTG TAACTACTTT 300 

4S CCATTCGCTC CATCCTATCA ATTCAAAATG ATGATGAATC GGACTCATTT TAAATATACG 360 

CTTTCCAGTC AATTTAAAGC TAGCGACTTG TAACATAACA GATAATGTTT CAATTACGAA 420 

TACTAAACCT ATAAAAATTA ATGATAATTC CTGATTAAGC ATGATTGAAA TGGTAGCAAA 4 BO 

SO TATACCACCT AAAGCTAAGC TACCTGTATC TCCCATAAAC ACTTTAGCAG GGTTAATGTT 54 0 

ATATGGTAAA AATCCTAAAA GTGCAAACAA CATAATGATA CAGAAAATAC CAATTGCCGT 600 
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TGCTAATCCA T.CTAAACCAT CTGTTAAATT TACTGCATTA GAAAAACCTA CTTGCCAAAA 
AACAATGAAA ATAACATATG CAAATGATAG TGGGATTGCT ACATTCGTAA ATGGAATATG 
TATGCTCGTA GAAAAATTCA CCAAATGAAA CACATTACTT AAAACAAAGA ATATAATCGC 
AATACCAATT TGCGCCAAAA ACTTCTGTTT ACTTGTTAAA CCTTGGTTAT TCTTTTTAAC 
AACAATAATA TAATCATCTA TAAAACCAAT TAACCCAAAA CCAATCGTCA CAAATAATAA 
CAGTATGATT GGATTAGCTT GATCTACAAA TATAATAGCC ACCAAAGACG TTATCACAAT 
ACTTAATAGA AATGTTAGTC CACCCATCGT TGGTGTACCA GTCTTCTTCA TATGGCTTTG 
TGGACCTTCT TCTCGAATAC TTTGACCAAA TTTCATCCTT TTTAATGTAG GTATTAAAAC 
AGGTACCAAA ACAAATGTAA TCACTAGCGC TAATAACGCA TATACAAAAA TCATAACTAT 
CTCCTCTTCT TAATCCAGAC TTTTTTAACC ACTAATATAT TATCAATTTT TCAATTAAAT 
AAACAAAGTT GTAATCAAAA TTTATAATTT TTCTTTTTTA CGGCATAAGA GGCCAGTATA 
AAAAGTTTGC CTATAACAAA CAAGTTAATC TGACCTCGTC TACCTTAAAA TTCTCTATCA 
ACACTTATTT ATAAAGATTA AATGAAGATG TTGTTTTCTA TCACAGCATT ACTTTAGTAA 
AAACAAATAG TGACAATACA TCCTAATTTA ATGTAGCCAT TCTTGTTAGT CCGACTTATC 
CTTGTCAGTT TTACTGTCAG ATTTCnTCTT ATCATCTGAA TTTGAATCAG AATTATTCGT 
CGAATTGCTG TCTACATTCT CTGGATGGAA AATTCTACGT 
(2) INFORMATIOK FOR SEQ ID NO: 160: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1186 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 160: 
ATTGCCTTTG TTTTAATTTT AAATCAAAAT cnGCCTATGAA AGATTTAAAT CAATTAATTT 
CTATAATATT ATCATTTTTA AAGCATATCA TTGTTTAGTT TTTTTATAAT TGGATAAATA 
CTAATAGTTA CTTTATAAAA CATTACATAG AGAAAGGTTA AGGAGTGCAC ATGTCGAAAA 
AGGATCACTC TTCTTCAAAA TACCTTAATT CTGTTAAGGA AGCGCAAGAG GAGTCAAAAA 
AGAAAAATAA AAGTAATCCC AAAATTGATG TTGATCGTAC ATATATTGAA CCTCAACAAT 
TCCAATCTAA GAAACCTAAA AAAGATGATC AGGTTTTCTT CTTATCAAGA TTAAATAAAC 
CTGCAAAATA TAAGAAAGAC TCTAATTTCT TATCATATCT CATCTATCGC ATAGGAAAAG 
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TGTTGCTTTT CCTATTAACA TTATTACCAT TTTTCAATAT TAAGCAGAGT CAAATTACTA 540 

ATATGTTAAG CAATGCACCC GCTGAAACAT CTACTCTAAT TAAGAGTGTA ATTGGTGATA 600 

TAACTCAAAA CTCCAGTGGT GGCTTATTAT CTATCGGTTT GATTTTAGCA ATTTGGTCAG 660 

CTTCAAATGG AATGACTGCA ATTATGAATT CTTTCAATGT TGCTTACGAT GTAGAAGATA 720 

GCCGTAATGG AATCGTATTA AAACTACTAA GTGTTGTCTT CACTGTAGTT ATGGGCGTTG 780 

TGTTTGTAGT TGCTCTAGCA TTACCAACGC TTGGTTCTGT AATTAGTCAT TTCCTATTCG 840 

GTCCACTTGG aTTTGACGAA CAAGTGAAAT GGATTTTTAA CCTTATTAGA ATTGTGTTAC 900 

CAATCATTAT TATATITATC ATATTTATCG TGTTATATTC GGTTGCACCT AACGTTAAAA 960 

CGAAGCTTAA GTCAGTATTA CCAGGTGCAG TATTTACTTC AATTATTTGG TTAGCTGGTT 1020 

CATTTGGTTT TGGTTGGTAT ATTTCAAATT TTGGTAACTA TTCTAAAACA TATGGCAGTA 1080 

TCGCGGGTAT CATCATTTTG TTACTATGGT TATATATCAC AAGTTTTATT ATAATTGTCG 1140 

GnGCTGAAAT CAATGCAAXC ATTCATCAGC GTAGTGTAAT TAAAGG 1186 

(2) INFORMATION FOR SEQ ID NO: 161: 

25 . (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 7872 base pairs 
(B^ TYPE: nucleic acid 
(C) STRANDEDNESS : double 
ID) TOPOLOGY: linear . 

30 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 161: 

TCTTGAGCCA TCTTTTGAGC TAACTGACTA GATTGATACC CAAAAATCAT AGTTACCAAC 60 

ATAAACTTTA ATTTTACCGA AGTCTAAATC AGCGATATGA GTACATACAT TATTTAAGAA 120 

ATGACGGTCA TGCGATACTA CGATAACAGT ATTATCAAAG TTAATTAAGA AATCTTCTAA 180 

CCAACTGATT GCTGGAATAT CGAGACCGTT AGTAGGCTCA TCCAGTAATA GTACGTCTGG 24 0 

TTCACCGAAT AAACTTTGCG CTAATAATAC TTTAATTTTT TGGTTGTTTT CTAATTCAGC 300 

CATTTTTTTA TCGTGTAAAG TTGGATCGAT ACCTAAACCA GATAAAAGGT TAGCAGCATC 060 

AGCTTCAGCA TTCCAACCAT TCATTTCTGC AAATTCACCT TCAAGTTCAG CAGCACGGAT 420 

ACCATCTTCA TCACTGAAAT CTGGCTTCAT ATAGATTTCA TCTTTTTCTT TCATAACCTC 480 

ATAAAGACGT TCGTGACCTT TAATTACAAC ATCAAGCACG CGTTCATCTT CATAAGCATA 540 

50 GTGGTCCTGT TTTAAAACAG CTAGACGTTC ATTTTTCCCT AATGAAACAT GTCCTGTTTG 600 

AGAATCTAAT TCACCAGATA ATATTTTTAA GAATGTTGAT TTACCTGCAC CATTCGCACC 660 
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ATCTCCAAAA CGTAAACTCA CATCAGTTAC TTGTAACATG CATTTTCTCC TTTTTTTCAT 780 

TCGATATTCT AACGGAAGAA TTATATCATA TTATCGTCAC AGTTTCGACC TCATATAAGT 840 

^ TGTAATGATA GAATGACTCA CACATGTTAT AATAATAAAG AATACAAGAA TCGAAGGAGA 900 

ATAACATGGC ATTAGACAAA GATATAGTAG GTTCTATAGA ATTCCTTGAA GTAGTAGGGT 960 

TACAAGGTTC AACTTACCTT TTAAAAGGAC CAAACGGTGA AAACGTAAAG TTAAACCAAT 1020 

10 

CAGAAATGAA CGATGATGAT GAATTAGAAG TAGGTGAAGA ATATAGTTTC TTCATTTATC 10 BO 

CAAACCGTTC AGGTGAATTA TTTGCAACTC AAAATATGCC TGATATTACG AAAGATAAAT 1140 

ATGACTTTGC TAAAGTACTT AAAACGGATC GCGATGGGGC ACGTATAGAT GTTGGATTAC 1200 

15 

CCCGTGAAGT GTTAGTACCA TGGGAAGATT TACCAAAAGT GAAATCACTA TGGCCACAAC 1260 

CTGGTGATTA TTTGCTAGTT ACATTACGAA TTGACCGTGA GAATCATATG TATGGACGTT 1320 

2^ TAGCGAGTGA ATCTGTTGTA GAAAATATGT TTACACCTGT ACACGACGAT AATTTAAAAA 1380 

ACGAaGTCAT TGAAGCCAAA CCTTACCGCG TATTACGAAT TGGTAGCTTT TTATTAAGCG 1440 

AATCAGGTTA CAAAArTTTC GTACATGAAT CAGAACGTAA AGCTGAACCA AGATTAGGTG 1500 

25 AATCTGTTCA AGTTAGAATT ATCGGGCATA ATGATAAAGG TGAGTTAAAT GGTTCATTTT 1560 

TACCACTTGC ACATGAACGT TTAGACGATG ACGGCCAAGT CATCTTTGAT TTACTAGTTG 1620 

AATATGATGG TGAATTACCA TTCTGGGACA AATCAAGCCC TGAAGCGATT AAAGAAGTAT 1680 

30 TCAATATGAG TAAAGGTTCA TTCAAACGTG CAATCGGTCA CTTATATAAA CAGAAGATTA 1740 

TTAATATAGA AACAGGTAAA ATCGCTTTAA CTAAAAAAGG TTGGAGTCGA ATGGACTCAA 1800 

AAGAATAATC ATTTTTACAC GTGTCGTAGG ATGCGTGTTT TTTTTATTCA ATATTAAATC 1860 

35 

GGACAGATGA AGTAGTTTTT 7AAACATTCC TTTCAAAGTA AAAAATTAAA TAATTCAAAC 1920 

GAATAGGCTG GGaCATTAAG TTCTTAGGCA ATGTAAAAAA GCTGATTTCT ATTAATTATT 1980 

TGATGGAAAT CAGCTTTTTT GATATGTATT TTATAATGTA CAGCTCGTTG AGCTGCTATT 2040 

40 

TTCCTTATAT TAAGTGCCAT TAATACAAAA CCTAGCTCTC GTTTAACTTT ATTTATTCCT 2100 

CGAACTGACA TTCGAGTGAA aCCCAAAATA GCCTTCATAA ATCCAAAAAC AGGCTCTACA 2160 

TAAATTTTTC TATGACTATA GATTTTTTTC GTTTCTGGTT CAGAAAGCTT TTGaTTAATT 2220 

TGGGCTTTAA TGTATTTCAA AGTAAAATTA CATGTTAATA CGTAGTATTA ATGGCGAGAC 2280 

TCCTGAGGGA GCAGTGCCAG TCGAAGACAG GGGCCCCAAC ACAGAAGcTG ACATATAGTC 2340 

SO AGCTTACAAC AATGTGCCGG TTGGGGTGGC TGAGACGGCA CCCTAGGAAG GGACCCGTCA 2400 

TCAAAAATTC TATTTATAGA ATTTTACAGT . AATGTGACAG ACGGGCAAAG CGAAgCCATT 2460 
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CTTACTGCTG TTTTTTTAGG GATTTATGTC 
CGATAATTTT TCAGGAAGCA TTTTAATTTT 
AAAATTAATA TTTACATTTT CTTAACAATT 
GAGGTTAATA ATTCAAGGTT AAGATAAAGA 
ATACAGGGAG GATATTTCAA TGAAAAAATG 
AACACTATTA TTAGGTGCTT GTGGTGGCGG 
AGGGGAAGCT AAAGGTGATG GCTCATCAAC 
AAAATGGGCT CAAGATCACT CGGATGCTAA 
TGGTTTCCAA AAATTCATTG CAGGAGATAT 
AGATGAAGAG AAGCAAAAAT TACAAGATAA 
GCAAGATGGT GTAACGGTTG CTGTAAATAA 
ACAGCAATTA AAAGCAATTT ATTCTGGAAA 
ATGGCCAGAT AAAAAAATAA ATGCTGTATC 
CTTTGAAAAT GAAGTAATGA ATAAAGAAGA 
TGCTATCGTT TCTTCTGTAA CGAAAAACAA 
CTACGTACAA AATAAAGATA AATTAAAAGA 
AACAGAGCCT ACGAAAAAAA CAATTcAAGA 
CATTTAjTGTA AATGAAAAAG CATTGAAAGA 
CGTCTTAGAA GATAAAGGTA AAGCAGCTGA 
AACATACAAA TCACAATTAG ATGATTTAAA 
CGACAAGAAA TCTGATGATA AAAAGTCTGA 
TGTGTCTTGA AACATGATTT TGATGGTGAA 
CGAGACGCTG ATTTTGACAT TCAGTTAGTC 
ATCATTATTT TACAAATCTA ATTATTTTGG 
CATCTACTAA TGTTAAAGCT TTAATCGAAA 
ACAAAATTAT ACCAGTTATT TTAGCCGCAA 
GTATATTAAT CACATTGCTT TTAGAAACCA 
AATTTCTATT TTCTACTACT TGGAATCCTA 
CATTGATAAT AGGGACTTTA AAAATCACAG 



CCAGCCATTT TTGTATTCAT ATTTAAATTT 
ACTAATGAAG CAATATTTTT TAGATTAACA 
TTTTATGTAA CATTTACAGT TTCTAAAAAT 
TGTAATOUT ACAAATACTA TTTGTTGTTC 
GCAATTTGTT GGTACTACAG CTTTAGGTGC 
TAATGGTGGC AGTGGTAATA GTGATTTAAA 
AGTAGCACCA ATTGTGGAGA AATTAAATGA 
AATCTCAGCA GGACAAGCTG GTACAGGTGC 
CGACTTCGCT GATGCTTCTA GACCAATTAA 
GAATATCAAA TACAAAGAAT TCAAAATTGC 
AGAAAATGAT TTTGTAGATG AATTAGACAA 
AGCTAAAACA TGGAAAGATG TTAATAGTAA 
ACCAAACTCA AGTCATGGTA CTTATGACTT 
TATTAAAGCA GAAAAAAATG CTGATACAAA 
AGAGGGAATC GGATACTTTG GATATAACTT 
AGTTAAAATC AAAGATGAAA ATGGTAAAGC 
TAACTCTTAT GCATTAAGTA GACCATTATT 
TAATAAAGTA ATGTCAGAAT TTATCAAATT 
AGAAGCTGGA TATGTAGCAG CACCAGAGAA 
AGCATTTATT GATAAAAATC AAAAATCAGA 
AGACAAAAAA TAATAAGACG CAATTTCAAA 
TCATTATTTA GAGTACAAAG CTTGATTTAT 
TAcAAGCTTA TCAACTTAAA ATAGTGGTTC 
GAGTAATAGA AAGAGGTTTG ATTATGACTT 
AAAATAATAA TAAAAAAGGA AAGCATAATG 
TTTCAGCGAT TTCCATTTTA ACAACACTAG 
TCACTTTTTT CACCAGAATT CCAATAACTG 
CCGGTTCAGA CCCTAAGTTT GGTATCTGGG 
TTATTGCGAC TATATTTGCA GTTCCAGTCG 
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AACCGATATT AGAAATTTTA GCAGGAATAC 
CCTTTGTTAC ACCAGTATTA AGATCTTTCA 
GTCCCGGCTT AGTTGTCGGT ATTATGATTG 
CAATGGCATC TGTACCAAAT AAAATTCGAG 
TAGAAGTAGC AACTAAAGTC GTACTTCCCG 
TTCTCGCGAT TTCAAGAGCA ATTGGAGAAA 
CGCCAACAGC TTCATTAAGT TTAACAAGTT 
AGATAGCGAC AGGTGATGCA ACATTTGGAT 
GGTTCACACT ATTTATCTTT ACCTTAATCA 
GTTTTAGGGA GGAGTATTAA TATGGAAACG 
CAACAACTTG TCCAAAAACA TTTATCATCC 
ATATTTTTAG CATGTACATT ATTAGGACTT 
TTGATTAAAG GGGTAAGTCA TTTAAATTTA 
CCATCTATGG cTGGCGTTAA AGGCGCGTTA 
ATTCCATTAT CAATCATCCT AGGAATAGGT 
AACAACAAAT TTACTCAGTT TGTTAAAATC 
GTTGTATTTG GGTTATTAGG TTATACTTTG 
AAAATGGGTA ACAGTATATT GGCAGCAGCG 
ATTATTGTTT CAAGTCAGGA AGCAATTAGA 
ACGGCTTAGG TGCTAATAAA TGGCAAACGA 
CTGGTATTTT AACTGGATTC ATTTTGTCTC 
TTGTGCTAAT CGGTATACCG ACTATATTAT 
TTTCAGCATT ACCTATCCAA ATATTTACTT 
ATGTTGCATC GGCAGGCATT ATCGTTTTAC 
CGATTATTTT ACX5TAACAAA TTTAGTAAAA 
TCTATTAAAA AGGGAGTTTT AAATATGGCG 
CAAAGTCATA CGTTTGATGT CTCACAAAGT 
CATTCTGTTA TATATTCAAC ACAAAATTTA 
CAAAATATTA ATTTAGATAT TTATGAAAAC 



CAACAATTGT GTTTGGTTTC TTTGCATTAA 
TACCAGGTCT TGGAGAGTTT AATGCTATAA 
TCCCTCTCAT CACAAGTTTG AGTGAGGaTG 
AAGGTGCCTA TGGACTTGGA GCAACTAAAT 
CAGCAACATC AGGTATTGTA GCTTCAATCG 
CGATGATTGT ATCATTAGCG GCAGGTAGTT 
CGATTCAAAC AATGACTGGA TATATTGTTG 
CAAATATTTA TTACAGTATT TATGCTGTAG 
TGAATTTACT TTCTCAGTGG ATTTCTAAGC 
ACAGATAATA ATAGACAATC ACTCGTCGAT 
AGAACGGTTA AAAATAAAGT GTTCAAACTC 
GTCGTACTTA TTGCGTTGTT AACTCAAACA 
CAGTTTTTCA CTAATTTTTC TTCTTCAACA 
ATCGGTTCAC TTTGGTTAAT GTTAAGTATC 
ACAGCTATAT ACTTAGAAGA ATATGCGAAA 
AGTATTTCCA ATTTAGCTGG TGTACCATCA 
TTCGTTGGTG GTGCAGGGAT TGAAGCCTTG 
CTAACAATGA CCTTACTGAT ATTACCAATT 
GCTGTACCTA ACTCAGTACG CGAACTTcTT 
TAAGACGTGT TGTCTTACCA GCAGCGTTAC 
TTTCAAGA6C ACTGGGAGAA ACAGCGCCAC 
TGGCAACACC TAGAAGTATA TTGGATCAAT 
GGGCGAAAAT GCCTCAAGAA GAATTCCAGA 
TAGTTATCTT AATCTTAATG AATGGCGTTG 
AATTCTAATT TAAACAATCA ATCTCATTTA 
CAAACACTTG CACAAACTAA ACAAATATCT 
CATCATAAAA CACCAGATGA TACAAACTCA 
GACTTATGGT ATGGCGAAAA TCATGCATTA 
CAAATTACTG CCATTATAGG TCCATCTGGT 
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AAAACAGCTG GTAAAATATT ATATCGAGAT CAAGACATTT TTGATCAAAA ATATTCTAAA 6180 

GAACAATTAC GTACAAATGT GGGCATGGTC TTTCAACAAC CTAATCCATT TCCAAAATCA 6240 

ATATACGATA ATATTACTTA CGGTCCAAAG ATTCACGGTA TTAAAAATAA AAAAGTTCTT 63 00 

GATGAAATCG TTGAGAAATC ATTACGTGGC GCTGCAATTT GGGATGAATT AAAGGATAGG 6350 

TtGCACACAA ATGCATATAG TTTATCCGGT GGGCAACAAC AACGTGTTTG TATCGCGCGT 6420 

TGTTTAGCAA TTGAACCTGA AGTCATTTTA ATGGATGAAC CGACATCAGC ATTAGATCCA 6480 

ATCTCAACAT TAAGAGTAGA AGAGTTGGTT CAAGAACTAA AAGAAAAGTA TACAATTATT 6540 

ATGGTtACAC ATAATATGCA ACAAGCAGCT CGTGTATCAG ATAAAACTGC ' ATTTTTCTTA 6600 

AATGGTTATG TCAATGAATA TGATGATACT GATAAAATTT TCTCTAACCC ATCAAACAAG 6660 

AAAACAGAAG ATTATATTTC AGGAAGGTTT GGTTGATATA TAATGGCAAT AATTAGACAA 6720 

CGATATCAGG AGCAACTTGA TGATTTAATA AAAGAATTAC GTCGGTTAGG TGCaAATGTC 6780 

TATGTGAGTA TTGaAAATGG TATAAAAtCA TTAAGTATTG aCGATAGAGG CTTTGCACGA 6840 

CAAACAGTTA AAAACGATAA ACATATCAAT CAATTAAATT ATGATATTAA TGAGCGAGTT 6900 

25 ATCATGTTAA TTACAAAGCA ACAGCCCATT GCGAGTGATT TGCGTATGAT GATTTCTTCA 6960 

TTAAAAATCG CCTCCGATTT AGAAAGAATA GGAGATAATG CCTCGAGTAT TGCCAATATT 7020 

CGATTGCGTA CAAAGATTAC AGATGATTAT GTGTTAACCC GTTTAAAGAC AATGGGTAAA 70 80 

TTAGCTATGT TAATGTTAAA GGACTTAGAT CAAGCATTTA AAAAGAAAGA TACCGTATTA 7140 

ATAAGAGAAA TAATTGAGCG TGATGAAGAT ATCGATGACT TATATAGTCA TATTATTAAC 7200 

GCAACGTATC TTATTGATAA CGtCCATTTG TCGCTGCACA AGCTCATTTA GCAGCAAGAC 7260 

ATTTAGAACG TATTGGTGAT CATATTATTA ACATCGCTGA AAGTGTTTAT TTTTATTTAA 7320 

CAG<3TACACA TTACGAACAA TAACTTAAAG TTATTACTAT AAAATCCCTT ACGATAAATA 73 30 

TATATTTCTA TTATTCATAA ACCCTCAAAA AAACCAAGAT TCTCACAATT AGTAATGTGA 7440 
AAATCTTGGT TTATATTGTT CTACTATAAA TTGTCTCGCA TCTTAGTTAT TTGCTTGCTC " 7500 

AATTTCATCT GTTAATTTTT CAACTTCATC GACTAAATCA GAAATATATT GAATTGTAGA 7560 

TTTAAGTGGC TGTTCTGTAG TAATGTCTAC ACCTGCAATG TTTGCAAGTT CGACAGGTGA 7620 

TACACTACCA CCTTTTTTCA ATGTTTCTAA CCAAGCATCA ACAGCTGGTT GGCCTTCATT 7680 

TTTAATCTTT TGAGAAACGA CAGTTCCGAT TGTTAAGCCA GCAGAATACG TATACGAATA 7740 

TAATCCCATA TAGTAATGAG GTTGACGCAT CCATGTTAAT TCAGCACCCT CAGTCATGTC 7800 

TACTGCATCT CCAAAAAATT GTTTATAAAC ATTTAGCATT ATTTCATTTA ATGTnCGGCG 7860 
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(2) INFORMATION FOR SEQ ID NO: 162: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 798 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



10 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 162: 





TTTTTTCTTT 


TCTTCATTTG 


AAAATTGATC 


ATTCAGCAAT 


ATAAGCGTAT 


TTGTTAATGA 


60 


to 


TTTAGGTGTT 


CCAATTTCAT 


AATCCCACCA 


ATTTAAGTTG 


GTATTCTTGC 


CAGTTGTTTT 


120 




AGTAAAATTC 


TCACTTAATT 


CTTTTACn'T 


TTTATCTGGT 


.TCTTTTCCAT 


ATGCATTTTT 


180 








^ X X ^ \»nV.» Jl <L X 


VrX XwX Ai\JL X X 


TCGTCAGTAT 

X WW X Si-XV«VXfl>i> 


TTAAAGTGGT 


240 


20 


TTTAGGATTC 


CTCATCGCTT 


CTGCGATTTT 


CTCAATATTA 


CGATAGGTAC 


OAGTCATATG 


300 




AGAAGAATTA 


GTTTCAAGGG 


TTTCCGCTCC 


TGACCACAAG 


TATTTCCTAC 


CACTTTCAGT 


360 




TTTCATTTCC 


TTGAGTAAAT 


TCGTCGCCTC 


TTTCTCTGTA 


GCATCAAACT 


TCTTCTTCAT 


420 


25 


ATCTGGATTA 


TTCTCATCAT 


ACTTATCATA 


ACCATAGTTA 


ACGTCCAGCC 


ATGTGTTCCT 


480 




CAATTTTTCA 


TAATCTGGCG 


TTTGAACATT 


CGTATCAGCC 


ACAGCGATTT 


GATGTTTATC 


540 




AACACTTCTG 


AATTCACCAC 


CATTCAAAGT 


AATCACACCA 


GCCATTAATA 


ACGTAATGGT 

• 


600 


30 


GGATAATTTT 


TGCCATTTCT 


TTATTCTATA 


TGTCATTGaC 


ATGTCTCCTT 


TTTGTGTTGC 


660 




GCGTGCGCAA 


TGAATATTAT 


GATTAAATAA 


TGATTCAATT 


TTTCAAAATT 


CGTTAACGTA 


720 


35 


TACAAATGAC 


TGTCTACTGT 


CAAACAATCC 


ACAAAGAATG 


TTGATGCCAT 


ATaAACAATC 


780 


GATCACCCAA 


ATTTTCCG 
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(2) INFORMATION FOR SEQ ID NO: 163: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 5X32 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

45 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 163: 
TACAGGTTTT ACTATAATGG ATGGTATTTT GGCTAAACGA CATTGGTTTA GTCTTCTTTT 60 
50 TTTnACTTCC TAnATTTACA ATGGTATAAA TAATAATGCT ATATTTAGAA TGATGAGTAT 120 
ACTTACTGAA ACTAAATTAA AAGTGTCTGG TTCTTTACTA AAGATAGCTG CTATCCTTGC 180 
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AATACAAGTT CCAATGAGCG CAATTAAAAG TACTAACCCA ACGATGAAAC TCTGTTTGTC 300 

ACTTAACTCA AAGAAACTAT AGATAGGATA TTTTTTAATA ATCAAGCCAC CTAAAATCAT 360 

CCATAAAAAT ACGATAATTC CATAAGTCAC ATTTATAACA TACGTTATTT TTTGGTCACC 420 

AAATCGGACT AATGTATTTC GTAGAATCAG CATACCAATG ACAACACCTA AAATAACGAT 430 

ACTAGCTATA TAAAGTAAAA ATGCAATTGT CACATCAAAT GTACCCAAAT CTAAAAACCT 540 

AGGAATTAyA AyGACTGCTA AAATAAAAGC GAAGyACAAA GTAATATAkT TATACAAACC 600 

GGTAGTAAGA CTTATCTCAG GTGATAATTG ATCAGCCATT GACTTAATCG GTGTATTAAT 660 

AATTGAACTT GTATCTTCGT TATTTTTTTC AGCCATAGTT AAATGATCTT CGAGCTCTTC 720- 

CAATAACTCT TCTACTTCTG CTTCAGTCTT ACCTCTAAAT AACAATTCAA CACGTAATTT 780 

TTCTAAAAAA TCTTGAGATT GTTTACTTAA CATCGTTTTC CCCTCCAAAC AAGTTAATCA 840 

TCCCTTTATT CAAAACTTGC CATTTCGATT TAAATACTTT TAGTTCCTTT AAACCTGAAT 900 

CGGTAATCGT ATAGTATTTC CGCCTCGGGC CGCCATTACT AGATTTTTTT ATTGTCGTAT 960 

CAACGTATCC TTmTGTTT AAACGCATTA AAACTGGATA AATACTACCC TCACTTATCT 1020 

CTGGAAACTC TTGATTCTTA AGTTTCGTCA TAATTTCATA TCCATACGTT TCGCCTTGGG 1080 

CAATGAGACC TAATATCGCC CCATCTAAGA GACCTTTCAT AATCTGATCT GACACTGACA 1140 

TTTTAATCAC CTACTATCTT ACATAATAAG ATAGTACATT GAGAACTTTT CGTCAACTAT 12 OO 

30 CTTTTATTGT AAGGTAGTTG TTGTACACAT TCCTTAAATG ACTAACAACT TTGTTAATAG 1260 

GGTAATACTT ACGGAAGTAT ATTTTATTTA TGGGGGAGGA ATTAATAATG ACTACAAAAA 1320 

CAGTATTTGA TGTCATTGAT ATGGGGTTAG GATATTTAGT AAATGTGTAT GATGCTTGGA 13 80 

AAGTTGAAAA GGTAC7TGAT GATTATCATA AGCCTTTTTC TAATACCATT CATTGGCAAT 1440 

TTGGtCATGT ATTAACAATT TTTGAATCGG CCTTAGCTGT TGCTGGTAAA GAGAATATTG 1500 

ATTTAAATAT CTATAGACCT TTATTCGGAA ATGGTTCGTC TCCAGATGAA TGGAAGGATG 1560 

AAGTACCGAG TATTGAAAGG ATTTTAGAAG GTCTCCAAAC TTTACCTGAA CGTGCACGAA 1620 

ATCTAACTGA AGATGATTTA GCAATTGAAT TGAAACAGCC AATTGTCGGT TGTAATAACT 1680 

TAGAAGAGTT ATTAGTATTA AATGCCATTC ACATCCCACT TCATGCTGGT AAAATTGAAG 1740 

AGATGTCTCG TATATTAAAA AATTTAAAAT AAATATGTGC TTATTAACCG TTAACAACAC 1800 

GTTAACGGgT TTTTTATTTG TTTAAAAGGT CACTTTTTTG AATTTAATAA ACACCATCTA i860 

SO TACCAGTTCT TCACCGATTC TCGAAAAATA ATTATATTAA TGATTTCGTT AATTTAATTT 1920 

TATATTTAAT TATTACTGTA CATCTTTTGT AGTTAGCTTT ATTCTTAAAT TGAAATATGT 1980 
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TACTCCCTAT CGTTGTAGGT CTCCTTATTT GGGCACTTAC ACCTTTTAAA CCGGATGCTG 2100 

TGGATCCAAC AGCATGGTAT ATGTTCGCAA TATTCGTCGC GACAATCATT GCTTGTATTA 2160 

CACAACCGAT GCCAATTGGG GCCGTCTCTA TAATTGGATT TACAATCATG GTACTCGTTG 2220 

GCATTGTTGA CATGAAAACG GCTGTCGCTG GTTTTGGTAA TAATAGCATT TGGTTAATTG 2280 

CTATGGCATT TTTCATTTCG AGAGGATTTG TGAAAACAGG TCTTGGTAGA CGTATCGCAC 2340 

TTCATTTCGT CAAATTATTT GGTAAAAAAA CATTAGGATT AGCATATTCT ATCGTCGGTG 2400 

TAGATTTAAT TCTAGCGCCT GCTACACCAA GTAATACCGC GCGTGCTGGT GGAATCATGT 2460 

TCCCAATTAT CAAATCACTT TCTGAATCAT TTGGTTCGAA ACCGAAAGAC GGATCAGCAC 2520 

GCAAAATCGG TGCArTTCTT GTTTTCACAG AATTCCAAGG TAATTTAATT ACTGCGGCTA 2580 

TGTTTTTAAC TGCAATGGCC GGTAACCCCC TTGCACAAAA TTTAGCATCT AGCACATCTA 2640 

ATGTTCACAT TACATGGATG AATTGGTTTC TAGCTGCTTT AGTTCCTGGA CTTGTTTCCT ■ 2700 

TAATTGTTGT ACCTTTTATT ATTTATAAAA TTTATCCACC AACTGTTAAA GAAACACCAA 2760 

ATGCTAAGAG TTGGGCTGAA AATGAATTAG CGACTATGGG TAAAATCGCT TTAGCTGAAA 2820 

25 AATTTATGAT TGGTATTTTT GTCGTTGCGT TAACACTATG GATTGTCGGA AGTTTCATTC 2880 

ATATTGATGC AACTTTAACG GCCTTTATTG CGCTAgcATT gTTATTATTG ACAGGCGTCT 2940 

TAACATGGCA AGACATTTTA AACGAAACAG GTGCTTGGAA CACATTAGTA TGGTTCTCAG 3000 

TATTAGTGTT AATGGCCGAC CAATTAAACA AGCTTGGATT TATTCCTTGG TTAAGTAAAT 3060 

CCATTGCTAC AAGTCTTGGT GGCTTAAGCT GGCCTATAGT CCTGGTCATT TTAATATTGT 3120 

TCTACTTCTA TTCACATTAC TTATTTGCAA GTTCTACAGC ACATATCAGT GCGATGTATG 3180 

CAGCATTACT AGgCGTTGCC ATCGCAGCCG GTGCACCACC ATTATTCAGT GCATTAATGT 3240 

TAGGTTTCTT CGGTAACCTA TTAGCTTCAA CAACACACTA TAGTAGTGGT CCAGCGCCGA 3300 

TTCTATTCTC TTCAGGTTAC GTGACTCAAA AACGTTGGTG GACAATGAAC TTAATATTAG 3360 

GTTTCGTCTA CTTTATTATC TGGATTGGTT TAGGATCACT TTGGATGAAA GTAATTGGTA 3420 

TATTTTAAAA TATTTAAATT AGCGCTCGAA TCTCATTGAT TTGGGCGCTT TTTAATTTGT 3480 

ATTTAAAATC AACCTTTGCT AAATCAAGAC TCCCTTTTTA AAATACGTTT ATCCTTTAAA 3540 

TCATTGCGTG CTTCACTGAA AATTTGTATA AAGATTTAAG TCATTACGTA ACATCACATA 3600 

AAATACATTT CTATACTATT CCGCTTCATT GATTAACATT ACGTATGCCC TCATAAATCA 3660 

50 TCATACAAAA AACACCTTCG TTTAAATTCA TTTTAATTGC GAATTCAACG AAAGTGCCTT 3720 

ATTTCATATT TAATGTTTCA AATTTATACG TCTGTCACTG TTACTGCACA CATACCTCAG 3780 
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TTATAGGGTT TTTGCGACCG GATGTTTCTT CAATTTAATG TATTGAGAAA GACTATATAA 3900 

CACAATACCT GTCCAAATAA ATATAAACGT AATTAATTGA TCTATACTAA AAGGCTCTTT 3960 

GAAAACAAAT ATGCCGAGTA CAAACATTAT TGTTGGTCCA ACGTATTGAA TAAATCCTAT 4020 

TAGCGAAAGT GGAATACGTT T7GCCCCGGC TGAGAATAGG ATTAGTGGTA TTGCCGTAAT 4080 

AGCACCAGAA AATAACAACC AAAATGATGA CATGTTCAAT CCAAATGACA TCTGATGTTG 4140 

CTGCCATAAA TAAATAACGT ATATTAGTCC AGCAGGTGCG GTAACAATAC ATTCAATCGT 4200 

AATACTGCTG ATGGCATCAA TATGTACTAC TTTTTTCAAT AATCCGTATG TACCAAAGGA 4260 

TAACGCTAAT ATAATAGAGA CGATTGGGAA TTCTCCAATC TTGAGCGTCA TATATAATAC 4320 

ACCGATGAAT GCGAATAAAA TGGCTAGCCA TTCAAATTTA TTGAATCTTT CTTTTAAAAA 4380 

GATAAGTGCG AGCAAAATGC TAACAAGTGG ATTTATATAA TAACCTAAAC TTGTTTGTAG 4440 

GACGTGACCG TTCX5TTACAG CCCAAATAAA TGTACCCCAA TTTAATGTAA TGACATAGCC 4500 

TGCTACGACA ATCGCTAATA GCTGAATGGG CTTGCCTAAC AATTGATTCA TATCTCGTTG 4560 

AAATGCATTG CGTTGTTTTT GTCCAACCGC GAGTATGAAA ATCATGAATA TTGCTGAAAA 4620 

25 TATAATACGA AAGGCTAAAA TTTCAAATGC GCCTATTGCA TCAACGAACT GCCAATATAT 4680 

AGGTAGTATT CCCCACAGAA TGTATGCACT GAGTGCTAAA AATATGCCTT TTTTATACTC 4740 

TGAATTCACC TTCAAACCTC CTTACTTTCC TAATTTTTAA TTTACTGCAT ACGCTCACTT 4300 

GGTTATGCTA ATATAACGAT TTTACTAATA ATATTTCGAT AAAGATATCA TTTTGTTTAT 4860 

ATTTCCCACA TTTATTCACC AACCACTAAA C7ATATTAAT TTTATAAATA ATTCTGTACA 4920 

AATCAGGGTA TATTGCCAGA AAGACTACCA TACAACATAA AGGATGGATA CAAATGACTT 4980 

TACCTAAAAT TGGAAAGCCT GCAACACGCG CGCTAAATTC ACAAGGTATA TACACATTAG 5040- 

AAGCAGTATC ACAATATACG AAGTCATCTC TAATGGAGAT GCATGGCGTT GGTCCTAAAG 5100 

CTATATaUVT ATTGGAACAA GCTTTATTTC AG 5132 
(2) INFORMATION FOR SBQ ID NO: 164: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH; 22243 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDBDNESS : double 

(D) TOPOLOGY: linear 
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so (Xi) SEQUENCE DESCRIPTION; SEQ ID NO: 164: 

AAGTAAATTA TATTATGAAT TTGCCTGTCA ATTTCTTAAA GACATTCTTA CCGGAACTAA 60 
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TAGAAGCAAT TAATAATGCy mAAGAAAAGA CAGCTAATAA TACCGGCTTA AAATTAATAT 180 

TTGCAATTAA TTATGGTGGC AGAGCAGAAC TTGTTCATAG TATTAAAAAT ATGTTTGACG 240 

AGCTTCATCA ACAAGGTTTA AATAGTGATA TCATAGATGA AACATATATA AACAATCATT 300 

TAATGACAAA AGACTATCCT GATCCAGAGT TGTTAATTCG TACTTCAGGA GAACAAAGAA 360 

TAAGTAATTT CTTGATTTGG CAAGTTTCGT ATAGTGAATT TATCTTTAAT CAAAAATTAT 420 

GGCCTGACTT TGACGAAGAT GAATTAATTA AATGTATAAA AATTTATCAG TCACGTCAAA 480 

GACGCTTTGG CGGATTGAGT GAGGAGTAGT ATAGTATGAA AGTTAGAACG CTGACAGCTA 540 

TTATTGCCTT AATCGTATTC TTGCCTATCT TGTTAAAAGG CGGCCTTGTG TTAATGATAT 600 

TTGCTAATAT ATTAGCATTG ATTGCATTAA AAGAATTGTT GAATATGAAT ATGATTAAAT 660 

TTGTTTCAGT TCCTGGTTTA ATTAGTGCAG TTGGTCTTAT CATCATTATG TTGCCACAAC 720 

20 ATGCAGGGCC ATGGGTACAA GTAATTCAAT TAAAAAGTTT AATTGCAATG AGCTTTATTG 780 

TATTAAGTTA TACTGTCTTA TCTAAAAACA GATTTAGTTT TATGGATGCT GCATTTTGCT 840 

TAATGTCTGT GGCTTATGTA GGCATTGGTT TTATGTTCTT TTATGAAACG AGATCAGAAG 900 

25 GATTACATTA CATATTATAT GCCTTTTTAA TTGTTTGGCT TACAGATACA GGGGCTTACT 960 

TGTTTGGTAA AATGATGGGT AAACATAAGC TTTGGCCAGT AATAAGTCCG AATAAAACAA 1020 

TCGAAGGATT CATAGGTGGC TTGTTCTGTA GTTTGATAGT ACCACTTGCA ATGTTATATT 1080 

TTGTAGATTT GAATATGAAT GTATGGATAT TACTTGGAGT GACATTGATT TTAAGTTTAT 1140 

TTGGTCAATT AGGTGATTTA GTGGAATCAG GATTTAAGCG TCATTTCGGC GTTAAAGACT 1200 

CAGGTCGAAT ACTACCTGGA CACGGTGGTA TTTTAGACCG ATTTGACAGC TTTATGTTTG 1260 

TGTTACCATT ATTAAATATT TTATTAATAC AATCTTAATG CTGAGAACAA ATCAATAAAC 1320 

GTAAAGAGGA GTTGCTGAGA TAATTTAATG AATCTCAGAA CTCCTTTTGA AAATTATACG 1380 

CAATATTAAC TTTGAAAATT ATACGCAATA TTAACTTTGA AAATTAGACG TTATATTTTG 1440 

. TGATTTGTCA GTATCATATT ATAATGACTT ATGTTACGTA TACAGCAATC ATTTTTAAAA 1500 

TAAAAGAAAT TTATAAACAA TCGAGGTGTA GCX5AGTGAGC TATTTAGTTA CAATAATTGC 1560 

45 ATTTATTATT GTTTTTGGTG TACTAGTAAC TGTTCATGAA TATGGCCATA TGTTTTTTGC 1620 

GAAAAGAGCA GGCATTATGT GTCCAGAATT TGCGATCGGT ATGGGGCCAA AAATTTTTAG 1530 

TTTTAGAAAA AA7GAAACAC TTTACACTAT TAGGTTATTG CCTGTTGGTG GATATGTTCG 1740 

TATGGCAGGA GATGGCTTAG AAGAGCCACC AGTCGAGCCC GGTATGAACG TTAAAATTAA IBOO 

ACTTAATGAA GAAAATGAAA TAACACATAT CATATTAGAT GATCATCATA AGTTTCAACA 1860 
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CACTGCTTAT GATAATGAAA GACATCATTT 
AAATGGTAGC TTAGTTCAAA TTGCTCCGAG 
GCCGAAATTT TTAACATTAT TTGCGGGACC 
ATTTATTGGT CTTGCATATT ATCaAGGcAC 
TAAGTATCCA GCTCAACAAG CAGGATTACA 
ATATAAAATA TCTGAATTTG ATGATGTTGA 
GACGACTGTT AAATTTGAAC GTGATGGTAA 
GACT6AAAAA AAACTGACTA AAGTAAGTTC 
AGCGAGTGAA CATACACTTT TTAAACCAAT 
TAGTACTTAT ATTTTTACAG CTGTAGTAGG 
CTCATTTGAT ATGTTAAATG GTCCGGTTGG 
AGCGGGTATC ATTAGCTTAA TTGGTtnCAC 
GAATTTAATT CCTATTCCTG CACTAGACGG 
GATTTTCAGA AAACCAGTTA ATAAAAAAGC 
TTTCATGGTC GTTATAATGA TATTAGTAAC 
ATTTAGGAGG ATAAATAATT ATGAAGCAAT 
7GCCATCAGA AGCAGAAGCA CAAAGTCATC 
AAAGTACAAG TGGGATTTAT AGTTATTTAC 
CTGCAATTGT GCGACAAGAA ATGGAACGTA 
TACAACAAGC TGAATTATGG GAAGAATCAG 
TGCGTTTACA AGATAGaCAT GGAAgACAAT 
TTACATCAAT AGTAAGAAAT GAATTGAAAT 
aAATTCAATC TAAATTCCGT GATGAAAAGA 
ATTTATTATG AAAGATGCAT ATTCATTCCA 
TCAAGATATG TATCAAGCGT ATAGCCGTAT 
AGTAGTTGCA GATTCAGGTG CTATAGGCGG 
TGCTATCGGT GAGGATACAA TCGTTTACAG 
AAAAGCAGAA GTCGTTTACG ArcCAaATcA 
AATTGAAACA CCAAATGTTA AGACTGCGCA 



TAAAATTGCT AGAAAGTCTT TCTTTGTTGA 
AGACAGACAA TTTGCACATA AAAAGCCATG 
GTTATTTAAC TTTATATTAG CTTTAGTCCT 
GCcTACGTCT ACTGTAGAAC AAGTCGCAGA 
AAAAGGTGAT AAGATCGTCC AAATTGGCAA 
TAAGGCGTTA GATAAAGTTA AAGATAATAA 
AACAAAGTCA GTTGAATTAA CACCTAAAAA 
AGAGACGAAG TATGTTCTCG GATTCCAACC 
TGTATTCGGA TTTAAAAGCT TTTTAATCGG 
TATGTTGGCT AGTATATTTA CGGGCGGATT 
TATTTATCAT AACGTCGACT CAGTTGTTAA 
TGCGTTATTA AGTGTAAACT TAGGTATTAT 
TGGTCGTATT TTATTTGTTA TATATGAAGC 
GGAAACAACG ATTATTGCTA TTGGTGCCAT 
GTGGAATGAT ATTCGACGAT ATTTCTTATA 
CCAAAGmT TATACCAACG ATGCGTGACG 
GTTTATTATT GAAATCGGGT TTGATAAAAC 
CGCTAGCAAC ACGTGTGTTA AATAATATTA 
TCGATTCTGT TGAAATTTTA ATGCCAGCGT 
GACGTTGGGG TGCATATGGC CCAGAATTAA 
TTgCATTAGG TCCaACACAT GAAGAATTAG 
CATACAAACA ATTACCGATG ACATTATTCC 
GACCACGTTT TGGTTTAyTC GTGGGCGTGA 
TGCTGACGAG GCATCATTAG ATCAAACGTA 
TTTTGAGAGA GTTGGCATTA ACGCAAGACC 
TAGCCATaCA CATGAATTTA TGGCATTAAG 
TAAAGAAAGT GATTATGCTG CTAACATCGA 
TaAGCATACT ACTGTGCAAC CTTTAGAAAA 
AGAATTGGCA GACTTCTTAG GTAGACCAGT 
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GCGTGGCCAT CATGAAATTA ATGACATTAA ATTAAAATCT TATTTCGGCA CAGATAATAT 
TGAATTAGCA ACACAAGACG AAATTGTTAA TTTAGTTGGT GCAAATCCTG GTTCACTAGG 
TCCTGTAATT GATAAAGAAA TCAAAATTTA TGCAGATAAT TTTGTGCAAG ATTTAAATAA 
TTTAGTTGTC GGTGCTAACG AAGATGGTTA TCACTTAATT AATGTAAATG TAGGTAGAGA 
CTTCAACGTT GATGAATATG GCGATTTCCG TTTTATTTTA GAAGGCGAAA AGTTAAGTGA 
TGGTTCAGGC GTTGCACATT TTGCTGAAGG TATTGAAGTT GGTCAAGTAT TCAAATTGGG 
TACTAAGTAT TCAGAATCAA TGAATGCTAC ATTCTTAGAT AACCAAGGAA AAGCTCAATC 
TTTAATTATG GGTTGTTACG GAATTGGAAT TTCTAGAACG CTAAGTGCGA TTGTTGAACA 
AAATCACGAT GATAATGGAA TTGTTTGGCC TAAATCAGTT ACTCCGTTTG ATTTACATTT 
AATTTCTATT AATCCTAAGA AAGATGATCA ACGAGAACTA GCAGATGCAC TATATGCTGA 
ATTTAATACT AAATTTGATG TGTTGTACGA TGATCGTCAG GAACGTGCAG GTGTTAAATT 
TAATGATGCC GATTTAATTG GTTTACCACT GCGAATTGTT GTTGGTAAAC GTGCATCGGA 
AGGTATTGTA GAAGTTAAAG AACGTTTAAC AGGTGATAGC GAAGAAGTTC ACATTGATGA 
CTTAATGACT GTCATTACAA ATAAATATGA TAACTTAAAA TAATTAAGAT CGAATGAATT 
ATAAGAGTAG GAAAAAGCTG AAAGAAATCT GATGCTTATG TCCTGCTCTT ATTATTTTTG 
ATATAATGAT TATTCGATGA AAAATGACTG AAGACATAGT ATAATTAAAG ATAAATTTGT 
TTTAACAATA TAATGATTAG CCAAATATAA AGCATTTAAT TTTCTATCAT TACTATGCTC 
ACATAATCTA AATATTGTTC GAACACGTAA AAGTAATTTC TATTTAAGGT GGTAATTGTC 
TTGGCAATGA CAGAGCAACA AAAATTTAAA GTGCTTGCTG ATCAAATTAA AATTTCAAAT 
CAATTAGATG CTGAAATTTT AAATTCAGGT GAACTGACAC GTATAGATGT TTCTAACAAA 
AACAGAACAT GGGAATTTCA TATTACATTA CCACAATTCT TAGCTCATGA AGATTATTTA 
TTATTTATAA ATGCAATAGA GCAAGAGTTT AAAGATATCG CCAACGTTAC ATGTCGTTTT 
ACGGTAACAA ATGGCACGAA TCAAGATGAA CATGCAATTA AATACTTTGG GCACTGTATT 
GACCAAACAG CTTTATCTCC AAAAGTTAAA GGTCAATTGA AACAGAAAAA GCTTATTATG 
TCTGGAAAAG TATTAAAAGT AATGGTATCA AATGACATTG AACGTAATCA TTTTGATAAG 
GCATGTAATG GAAGTCTTAT CAAAGCGTTT AGAAATTGTG GTrTTGATAT CGATAAAATC 
ATATTCGAAA CAAATGATAA TGATCAAGAA CAAAACTTAG CTTCTTTAGA AgCACaTATT 
CAAGAAGAAG ACGAACAAAG TGCACGATTG GCAACAGAGA AACTTGAAAA AATGAAAGCT 
GAAAAAGCGA AACAACAAGA TAACAACGAA AGTGCTGTCG ATAAGTGTCA AATTGGTAAG 
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GCAATAGAGG GTGTCATTTT TGATATAAAC TTAAAAGAAC TTAAAAGTGG TCGCCATATC 5580 

• GTAGAAATTA AAGTGACTGA CTATACGGAC rCTTTAGTTT TAAAAATGTT TACTCGTAAA 5640 

AACAAAGATG ATTTAGAACA T7TTAAAGCG CTAAGTGTTG GTAAATGGGT TAGGGCTCAA 5700 

GGTCGTATTG AAGAAGATAC ATTTATTAGA GATTTAGTTA TGATGATGTC TGATATTGAA 5760 

GAGATTAAAA A^VGCGACAAA AAAAGATAAG GCTGAAGAAA AGCGTGTAGA ATTCCACTTG 5820 

CATACTGCAA TGAGCCAAAT GGATGGTATA CCCAATATTG GTGCGTATGT TAA^CAGGCA 5880 

GCAGACTGGG GACATCCAGC CATTGCGGTT ACAGACCATA ATGTTGTGCA AGCATTTCCA 5940 

■ 

GATGCTCACG CAGCAGCGGA AAAACATGGC ATTAAAATGA TATACGGTAT GGAAGGTATG 6000 

TTAGTTGATG ATGGTGTTCC GATTGCATAC AAACCACAAG ATGTCGTATT AAAAGATGCT 6060 

ACTTATGTTG TGTTCGACGT TGAGACAACT GGTTTATCAA ATCAGTATGA TAAAATCATC 6120 

GAGCTTGCAG CTGTGAAAGT TCATAACGGT GAAATCATCG ATAAGTTTGA AAGGTTTAGT 6180 

AATCCGCATG AACGATTATC GGAAACGATT ATCAATTTGA CGCATATTAC TGATGATATG 6240 

TTAGTAGATG CCCCTGAGAT TGAAGAAGTA CTTACAGAGT TTAAAGAATG GGTTGGCGAT 6300 

25 GCGATATTCG TAGCGCATAA TGCTTCGTTT GATATGGGCT TCATCGATAC GGGATATGAA 6360 

CGTCTTGGGT TTGGACCATC AACGAATGGT GTTATCGATA CTTTAGAATT ATCTCGTACG 6420 

ATTAATACTG AATATGGTAA ACATGGTTTG AATTTCTTGG CTAAAAAATA TGGCGTAGAA 6480 

30 TTAACGCAAC ATCACCGTGC CATTTATGAT ACAGAAGCAA CAGCTTACAT TTTCATAAAA 6540 

ATGGTTCAAC AAATGAAAGA ATTAGGCGTA TTAAATCATA ACGAAATCAA CAAAAAACTC 6600 

AGTAATGAAG ATGCATATAA ACGTGCAAGA CCTAGTCATG TCACATTAAT TGTACAAAAC 6660 

CAACAAGGTC TTAAAAATCT ATTTAAAATT GTAAGTGCAT CATTGGTGAA GTATTTCTAC 6720 

CGTAGACCTC GAATTCCACG TTCATTGTTA GATGAATATC GTGAGGGATT ATTGGTAGGT 6780 

ACAGCGTGTG ATGAAGGTGA ATTATTTACG GCAGTTATGC AGAAGGACCA GAGTCAAGTT 6840 

GAAAAAATTG CCAAATATTA TGATTTTATT GAAATTCAAC CACCGGCACT TTATCAAGAT 6900 

TTAATTGATA GAGAGCTTAT TAGAGATACT GAW^CATTAC ATGAAATTTA TCAACGTTTA 6960 

ATACATGCAG GTGACACAGC GGGTATACCT GTTATTGCGA CAGGAAATGC ACACTATTTG 7020 

TTTGAACATG ATGGTATCGC ACGTAAAATT TTAATAGCAT CACAACCCGG CAATCCACTT 7080 

AATCGCTCAA CTTTACCGGA AGCACATTTT AGAACTACAG ATGAAATGTT AAACGAGTTT 7140 

CATTTTTTAG GTGAAGAAAA AGCGCATGAA ATTGTTGTGA AAAATACAAA CGAATTAGCA 7200 

GATCGAATTG AACGTGTTGT TCCTATTAAA GATGAATTAT ACACACCGCG TATGGAAGGT 7260 
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CTGCCTCAAA TCGTAATTGA TCGATTAGAA AAAGAATTAA AAAGTATTAT CGGTAATGGA 73 80 

TTTGCGGTAA TTTACTTAAT TTCGCAACGT TTAGTTAAAA AATCATTAGA TGATGGATAC 7440 

TTAGTTGGTT CCCGTGGTTC AGTAGGTTCT AGTTTTGTAG CGACAATGAC TGAGATTACT 7500 

GAAGTAAACC CGTTACCGCC ACACTATATT TGTCCGAACT GTAAAACGAG TGAATTTTTC 7560 

AATGATGGTT CAGTAGGATC AGGATTTGAT TTACCTGATA AGACGTGTGA AACTTGTGGA 7620 

GCGCCACTTA TTAAAGAAGG ACAAGATATT CCGTTTGAAA CATTTTTAGG ATTTAAGGGA 7680 

GATAAAGTTC CTGATATCGA CTTAAACTTT AGTGGTGAAT ATCAACCGAA TGCCCATAAC 7740 

TACACAAAAG TATTATTTGG TGAGGATAAA GTATTCCGTG CAGGTACAAT TGGTACTGTT 7800 

GCTGAAAAGA CTGCTTTTGG TTATGTTAAA GGTTATTTGA ATGATCAAGG TATCCACAAA 7860 

AGAGGTGCTG AAATAGATCG ACTCGTTAAA GGATGTACAG GTGTTAAACG TACAACTGGA 7920 

CAGCATCCAG GGGGTATTAT TGTAGTACCT GATTACATGG ATATTTATGA TTTTACX^CCG 7980 

ATACAATATC CTGCCGATGA TCAAAATTCA GCATGGATGA CGACACATTT TGATTTCCAT 8040 

TCTATTCATG ATAATGTATT AAPiACTTGAT ATACTTGGAC ACGATGATCC AACAATGATT 8100 

25 CGTATGCTTC A?VGATTTATC AGGAATTGAT CCAAAAACAA TACCTGTAGA TGATAAAGAA 8160 

GTTATGCAGA TATTTAGTAC ACCTGAAAGT TTGGGTGTTA CTGAAGATGA AATTTTATGT 8220 

AAAACAGGTA CATTTGGGGT ACCAGAATTC GGTACAGGAT TCGTGCGTCA AATGTTAGAA 8280 

GATACAAAGC CAACAACATT TTCTGAATTA GTTCAAATCT CAGGATTATC TCATGGTACA 8340 

GATGTGTGGT TAGGCAATGC TCAAGAATTA ATTAAAACCG GTATATGTGA TTTATCAAGT 8400 

GTAATTGGTT GTCGTGATGA TATCATGGTT TATTTAATGT ATGCTGGTTT AGAACCATCA 8460 

ATGGCTTTTA AAATAATGGA GTCAGTACGT AAAGGTAAAG GTTTAACTGA AGAAATGATT 8520 

GAAACGATGA AAGAAAATGA AGTGCCAGAT TGGTATTTAG ATTCATGTCT TAAAATTAAG 8580 

TACATGTTCC CTAAAGCCCA TGCAGCAGCA TACGTTTTAA TGGCAGTACG TATCGCATAT 864 0 

TTCAAAGTAC ATCATCCACT TTATTACTAT GCATCTTACT TTACAATTCG TGCGTCAGAC 8700 

TrrGATTTAA TCACGATGAT TAAAGATAAA ACAAGCATTC GAAATACTGT AAAAGACATG 8760 

TATTCTCGCT ATATGGATCT AGGTAAAAAA GAAAAAGACG TATTAACAGT CTTGGAAATT 8820 

ATGAATGAAA TGGCGCATCG AGGTTATCGA ATGCAACCGA TTAGTTTAGA AAAGAGTCAG 8880 

GCGTTCGAAT TTATCATTGA AGGCGATACA CTTATTCCGC CGTTCATATC AGTGCCTGGG 8940 

so CTTGGCGAAA ACGTTGCGAA ACGAATTGTT GAAGCTCGTG ACGATGGCCC ATTTTTATCA 9000 

AAAGAAGATT TAAACAAAAA AGCTGGATTA TCTCAGAAAA TTATTGAGTA TTTAGATGAG 9060 
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GAAATAATCA AGGTATTTAT TTAATGCGTA 
CTGGACACAA AATTATGCCC GTATTTCTTT 
^ TGGTGAAATA AAGGAACAAA CTTTTACAAG 

TCAAGCATAA ACTTATGCTA TAATTAAGTT 
GTGGGAGATT CCCGCTCTTT TCTATTTGCC 

10 

AGAACAAGTA GAAGTGATTG TTAAACCAAT 
CGTTGAATAT GTCAAAGAGG GTAGAGATCA 
TGGCGTAGAT TTAAATGATT GTACGCTAGC 

15 

AAATGATCCT ATTCCTGAAA TGTATTATTT 
AATTAAAAAA GAACAAGATT TCCAAAATGC 
TGTACCAATT GAAGGTGAAA AGGAATGGTT 

20 

AATTGTAGTA CAAGTTAAAA TCAAAGCAAG 
AATAGCAAAA GCACGTCACG CAGTTATGAT 

25 AGTAATGAAT TATTATTAGC TACTGAGTAT 
GTATTAATTG ATGCTATTGA AGCAGCTTTA 
CCAAGAAATG TCCGTGTGGA ATTAAATATG 

30 AAAGATGTTG TTGAAGAAGT ATTTGACGAC 
GTTAAAAACC CTGCATATGA AATTGGTGAT 
TTTGGTCGTG TAGGTGCTCA AGCAGCGAAA 
GAAGGTGAAA TTTTATTTGA AGAATTTATA 
ATTGACCGTG TTGACCATCG TTATGTATAT 
TCTGAAGCAG AAAGAAGTCC TAAOGAAAAA 

40 

GTTAACAAAG TGGAACAAAC GACAAAAGGT 
GGTTTATTAA AACGTTTATT TGAACAAGAA 
GTTAAATCAG TAGCACGTGA AGCTGGCGAT 

45 

AATGATATAG ATGCTGTTGG TGCATGTGTT 
GTTGAAGAGC TAGGTGGTGA AAAAATCGAC 
so TTTGTAAAAA ATGCTTTAAG CCCTTCTCAA 
CAATCTACAG TAGTTGTTGT TCCTGATTAT 
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TGGCGTAGTC AAAGAAATAC AAAATTGTTG 9180 

TCAATGTCTT ACGAGTCTAT TCAAATGTAA 9240 

AATCTCTGAT TAATAGTGAA GTCATTTGTT 9300 

GCTTAAAAAT TAGTGAACTC AGGCAGAAGA 9360 

AAAAAGGGAG GCCTGTATGA GTAAAATTAC 9420 

TATGGAAGAC TTGAATTTTG AACTTGTAGA 9480 

TTTTCTTAGA ATCTCTATTG ATAAAGAAGG 9540 

TTCTGAAAAA ATAAGTGAAG CTATGGATGC 9600 

AGACGTAGCG TCACCTGGTG CAGAACGTCC 9660 

AATAACTAAA CCTGTATTTG TTTCTTTATA 9720 

AGGCATTTTA CAAGAAGTCA ATAATGAAAC 9780 

AACGAAAGAT ATAGAGATAC CGAGAGACAA 9840 

TTAACGTGAT GAGGAGGAAA AAACGTGTCA 9900 

TTAGAAAAAG AAAAGAAGAT TCCTAGAGCA 9960 

ATTACTGCAT ACAAAAAGAA TTATGATAGT 10020 

GATCAAGGTA CTTTCAAAGT TATCGCTCGT 10080 

AGAGATGAAG TGGATTTAAG TACAGCGCTT 10140 

ATATACGAAG AAGATGTAAC ACCTAAAGAT 10200 

CAAGCAGTAA TGCAACGTCT TCGTGATGCT 10260 

GACAAAGAAG AAGACATACT TACTGGAATT 10320 

GTGAATTTAG GTCGTATCGA AGCTGTTTTA 10380 

TATATTCCTA ACGAACGTAT CAAAGTATAT 10440 

CCTCAAATCT ATGTTTCTC6 TAGCCATCCA 10500 

GTTCCAGAAA TTTACGATGG TACTGTAATT 10560 

CGCTCTAAAA TTAGTGTCTT CTCTGAAAAC 10620 

GGTGCTAAAG GCGCACGTGT TGAAGCTGTT 10680 

ATCGTTCAAT GGAATGAAGA TCCAAAAGTA 10740 

GTTTTAGAAG TTATTGTTGA TGAAACAAAT 10800 

CAATTGTCAT TAGCGATTGG TAAAAGAGGA 10860 
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GATGCGCGTG AAGCGGGTAT CTATCCAGTA 
GTTGCTTTAG AAGATGCTGA CACAACAGAA 
^ GAAACAAATG TAGAGAAAGA ATCTGAATAA 

AAAAAATTCC GATGCGAAAA TGTATTCTTT 

TTCGTGTTCT TGTTAATAAA GAAGGCGAAA 

10 

GCCGTGGCGC ATATGTTTCT AAAGATGTTG 

TTTTAGAAAA ATATTTTAAA GCATCTAAAG 
TTAGATTAAT TTATAGAGAA GAGATCCCAA 

75 

AGGATTAGCA ATGAGACCTG GTAAAGTAAA 
TAAAAAAGGA AATTTGAAGC TCGTTATTGT 
ATTAATTACA GATAAATGTA AGAGTTACAA 

20 

TGAATTGGGA ATAGCACTTG GAAAAGGTGA 
CTTTGCTAAA AAGTTGCTAT CAATGATAGA 

25 AACAAAGAAT TTACGAATAT GCGAAAGAA7 

AGTTAAAAAG CATGAATATT GAGGTTTCAA 
TTAAAGCATT AGATAAAAAG TTCAAAAAAG 

30 AAAATAATCA CCAAAAATCA AACAATCAAA 

AAAAGAATOn ACAACAAAAT AATAAAGGCA 
ATAAGAAAAA TAACAAGAAT AATAAACCAC 
CATCAAAAGT GACATATCAA GAAGGTATTA 
TTGAATCATC AGAAATTATC AAAAAATTAT 

m 

AATCATTAAA TCAAGAAACA ATCGAATTAA 

40 

AAGAAGTTGT GATTAATGAA GAAGACTTAT 
CAGAGGCAAT TGAGAGACCA GCAGTTGTAA 
CGACTTTATT AGATTCAATT CGTCATACAA 

45 

CTCAACATAT TGGTGCATAT CAAATTGAAA 
CACCGGGACA TGCTGCATTT ACAACGATGC 
CTATTTTAGT AGTAGCAGCT GACGATGGTG 
ATGCTAAAGA AGCAgAAGTA CCAATTATTG 



GTTGAAGCTG AAAAAGTAAC TGAAGAAGAT 10980 

TCAACCGAAG AGGTAAATGA TGTTTCAGTT 11040 

TAGGTTGGAG TGAAGTATCT ATGAAAAAGA 11100 

CAAATGAAAT GCATCCCAPA AAAGATATGA 11160 

TCTTTGCGGA TGTTACTGGA AAGAAACAAG 11220 

CTATGGTTGA AAAAGCACAA CAAAAAGAAA 11230 

AGCAATTGGA TCCTGITTAC AAAGAAATTA 11340 

AATGAGTATA GATCAAATAT TAAACTTTTT 11400 
AACAGGTGAA TCAGTCATTG TTAATGAGAT - 11460 

TGCAAATGAT GCGTCTGATA ATACAGCTAA 11520 

AGTTCCATTC AGAAAGTTTG GAAATCGAAA 11580 

GCGTGTTAAT GTAGGGATTA CTGACCCAGG 11640 

TGAATATCAT AAGGAGTGAT TATATGAGTA 11700 

TAAATCTAAA GAGTAAAGAG ATTATAGATG 11760 

ATCATATGCA AGCTTTGGAA GATGACCAAA 11820 

AACAAAAGAA CGACAATAAA CAAAGCACTC 11880 

ACCAAAATAA AGGGCmACAA AAAGATAACA 11940 

ACAAAGGCAA TAAAAAGAAT AATAGAAATa 12000 

AAAATCAACC AGCTGCTCCA AAAGAAATAC 12060 

CAGTAGGCGA ATTTGCGGAT AAATTAAATG 12120 

TCTTACTTGG TATTGTTGCT AATATCAATC 12180 

TTGCCGATGA TTATGGCGTT GAGGTTGAAG 12240 

CAATCTATTT CGAAGACGAA AAAGATGATC 12300 

CAATTATGGG ACATGTTGAC CATGGTAAAA 12350 

AAGTTACAGC AGGTGAAGCA GGCGGAATCA 12420 

ACGATGGCAA AAAAATCACT TTCTTAGATA 12480 

GTGCGCGTGG TGCaCAAGTA ACAGATATTA 12540 

TTATGCCACA AACAATTGAA GCAATTAACC 12600 

TTGCAGTAAA TAAAATTGAT AAACCAACTT 12660 
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GCGGCGAAAC AATTtTCGTc CACTTTCTGC ATTAAGTGGT GATGGTATCG ACGATTTATT 12780 

AGAAATGATA GGATTAGTTG CAGAAGTTCA AGAACTTAAA GCAAATCCTA AAAACCGTGC 12840 

TGTTGGTACA GTTATCGAAG CTGAATTAGA TAAATCACGT GGTCCTTCTG CATCATTATT 12900 

AGTACAAAAC GGTACATTAA ATGTTGGTGA TGCGATTGTA GTTGGTAATA CTTACGGCCG 12960 

TATCCGTGCA ATGGTTAATG ACTTAGGTCA AAGAATCAAA ACGGCTGGTC CATCAACGCC 13020 

TGTTGAAATT ACAGGTATTA ATGATGTGCC ACAAGCTGGG GATCGCTTTG TTGTATTTAG 13080 

TGATGAAAAA CAAGCTCGTC GTATTGGTGA ATCAAGACAC GAAGCTAGCA TTATACAACA 13140 

ACGTCAAGAA AGTAAAAATG TTTCATTAGA TAACCTGTTT GAACAAATGA AACAAGGTGA 13200 

AATGAAAGAT TTAAACGTTA TTATTAAAGG TGATGTTCAA GGTTCTGTTG AAGCTTTAGC 13260 

TGCATCATTA ATGAAAATTG ATGTTGAAGG CGTAAATGTT CGTATCATTC ATACAGCGGT 13320 

TGGTGCAATT AATGAGTCAG ACGTGACACT TGCTAATGCC TCAAATGGTA TTATCATTGG 13380 

TTTCAATGTT CGTCCAGACA GTGGTGCAAA ACGTGCTGCA GAAGCTGAAA ATGTTGATAT 13440 

GCGTTTACAC AGAGTTATTT ATAATGTTAT CGAAGAAATT GAATCAGCGA TGAAAGGTTT 13500 

ACTTGATCCA GAATTTGAAG AACAAGTTAT CGGACAAGCT GAAGTTCGTC AAACATTCAA 13560 

AGTTTCTAAA GTTGGTACTA TTGCTGGATG TTATGTTACT GAAGGTAAAA TTACGCGAAA 13 620 

TGCTGGTGTA CGTATTATTC GTGATGGTAT TGTTCAATAT GAAGGCGAAT TAGATACACT 13680 

TAAACGTTTC AAAGATGATG CTAAGGAAGT TGCAAAAGGT TATGAATGTG GTATTACAAy 13740 

TGAAAACTAC AATGACCTTA AAGAAGGCGA TGTTATCX3AA GCATTTGAAA TGGTTGAAAT 13800 

TAAGCGTTAA TTAAATAAAT TACAAGCTAA AAGTATAGTT AAGATTGATA TGCTCCCTAT 13860 

AAATATTGCA CTTTTTAAGT GTCTACTTTA TAGGGAGCAT ATTTGATACT AGCTTTTGGT 13920 

TTT'FrATTAG AATAGATTAC CTATTAAAAG TTACGTTATA TGGACATGAT TTTGTATAAA 13980 

ATTTTGTGGT GGCCTAGAAT GATTTTTAAT GACAAAATAT AATGTCGACT ATTAXTGGAA 14 04 0 

AATTTTCTGT TGaAATGCCT ATCTTACGGC AAACTTTATT TGATTTTATA GGCTTAATTT 14100 

ATTAAAATAA CGTGTGAGCT AAAATAATTG TTTAAGCATT GTTACACTAA AAAATGCAAA 14160 

TAACAATTGA ACTTAAAGAT AAAGAGGTGA CAAGAATGAG CAGTATGAGA GCAGAGCGTG 14220 

TTGGTGAACA AATGAAGAAG GAATTAATGG ATATCATCAA CAATAAAGTC AAAGATCCTC 14280 

GAGTTGGTTT TATTACAATT ACAGATGTTG TTTTAACAAA TGATTTATCG CAGGCTAAAG 14340 

TATTTTTAAC TGTATTAGGT AACGATAAAG AAGTAGAAAA TACATTTAAA GCACTTGATA 14400 

AAGCAAAAGG CTTCATTAAG TCTGAATTAG GTTCTAGAAT GCGATTACGT ATTATGCCGG 14460 
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AAGATTTACA CAAACAAGAT AGATAATTTA 
TTCTTAATAT CX3GTATATTA ACATTAAACA 
5 CATTTTCCAG TTTTTTTATG AATAAATTTA 

AAGAAGGTGA CTATATGTAT AATGGGATAT 
GTCATGACGT TGTATTCAAA TTGCGTAAAA 

10 

GTACGCTTGA TCCCGAAGTT GCAGGCGTGT 
TTAGTGATTA TGTTATGGAT ATGGGCAAAG 
GTACAACGAC TGAAGATCAA ACGGGTGATA 

15 

ATTTTAATAA GGACGATATT GACCGATTGT 
TTCCGCCGAT GTACTCATCC GTCAAAGTAA 
ATAATGAAAC AGTTGAAAGA CCAAAGCGTA 

20 

CTGAATTAGA TTTTAAAGAA AATGAGTGTC 
GTACATATAT TAGAACGCTA GCAACTGATA 

25 TGTCGAAATT AACACGAATC GAGTCTGGTG 

AACAAATAAA AGAACTTCAT GAGCAGGATT 
ATGGATTAAA GGGTTTGCCA AGCATTAAAA 

30 TAAATGGGCA GAAATTTAAT AAAAATGAAT 

TTATTGATGA TGATTCAGAA AAAGTATTAG 
CAGAAATTAA ACCTAAAAAA GTCTTTAATT 
AGtGACACAT CCTATACAAT CTAAACAGTA 
ATTTrrCGAT GGCATGCATA AAGGTCATGA 

ft 

TGAGGCACGC AGTTTAAAAA AAGCGGTGAT 

40 

GAATCCTAAA AGAAAACGAA CAACGTATTT 
TAGCCAACAT GATATTGATT ATTGTATAGT 
GAGCGTAGAA GATTTTGTTG AAAATTATAT 

45 

TGGTTTTGAT TTTACTTTTG GTAAATTTGG 
TGATGCGTTT AATACGACAA TTGTGAGTAA 
AACTTCTATT CGTCAAGATT TAATCAATGG 
CTATATATAT TCTATTAAAG kCACTGTAGT 



GTGTTAGGTA TCTGGAAAAT GTTTGATAAT 14 5 SO 

GTTAATACAT AGATGTGTAG AAATAGTTAA 14640 

GTTGATACGC TATTAAAATA TATTTTAAAA 14700 

TACCAGTATA TAAAGAGCGC GGTTTAACAA 14760 

TATTAAAAAC TAAAAAAATA GGTCACACGG 14820 

TACCGGTATG TATAGGTAAT GCAACGAGAG 14880 

CTTATGAAGC AACTGTATCG ATAGGAAGAA 14 940 

CATTGGAAAC AAAAGGTGTA CACTCAGCAG 15000 

TAGAAAGTTT TAAAGGTATC ATTGAACAAA 15060 

ATGGTAAAAA ATTATATGAA TATGCGCGTA 15120 

AAGTtAATAT TAAAGACATT GGGCGTATAT 15180 

ATTTTAAAAT ACGCGTCATC TGTGGTAAAG 15240 

TTGGTGTGAA ATTAGGCTTT CCGGCACATA 15300 

GATTTGTGTT GAAAGATAGC CTTACATTAG 153 60 

CATTGCAAAA TAAATTGTTT CCTTTAGAAT 15420 

TTAAAGATTC GCACATAAAA AAACG7ATTT 154 80 

TTGATAACAA AATTAAAGAC CAAATTGTAT 15540 

CAATTTATAT GGTACACCCT ACAAAAGAAT 15600 

AAAGGAGATA GAATTTATGA AAGTCATAGA 15660 

TATTACAGAG GATGTTGCAA TGGCATTCGG 15720 

CAAAGTCTTT GATATATTAA ACGAAATAGC 15780 

GACATTTGAT CCGCATCCGT CTGTCGTGTT 15840 

AACGCCACTT TCAGATAAAA TCGAAAAAAT 15900 

GGTTAATTTT TCATCTAGGT TTGCTAATGT 15960 

AATTAAAAAT AATGTAAAAG AAGTCATTGC 16020 

AAAAGGTAAT ATGACTGTAC TTCAAGAATA 16080 

ACAAGAAATT GAAAATGAAA AAATTTCTAC 16140 

TGAGTTGCAA AAAGCGAATG ATGCTTTAGG 16200 

GCAAGGTGAA AAAAGGGGAA GAACTATTGG 16260 
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TGCTGTTAGT ATTGAAATCG GCACTGAAAA 
TGTAAAGCCA ACATTTCATG ATCCTAACAA 

5 

TGACTTTGAG GATAATATTT ATGGTGAACG 
TCCTGAGATT AAATTTGATG GTATCGACCC 
GCGTGCTAAA TATTTATTAG CAGTTGATTT 

10 

TTGCGTATAG tTATATAAAC AATCTATACC 
ACGCCTAACT CGGATTAAGG AGTATTCAAA 
TTCACAAGAA CGTAAAAACG AAATCATTAA 

IS 

TTCACCAGAA GTACAAATCG CTGTACTTAC 
ACGTACACAC AAAAAAGACC ACCATTCACG 

20 TAGcATTTaT TAAACTACTT ACGTaGTAAA 
TCACTTGGTA TCCGTCGTTA ATCTTAATAT 
TCCAACCTTA ATTTATATTA AAAAAGCTTT 

25 GCTAATATTG AGTGAATAAT AAGGTTACAA 

GTAATAATCA AGATATTAAA AATAAAGTAT 
ACTGATAAGG GTGGGACGAT AAGTCTATTT 

20 

TTTTTTCCAA TTCAATATTT TATAACTAAT 

AACTATTAGA TTCAAGAGAG GAGATTTATA 
GAATGGGCAG GAAGATCTTT AACGATTGAA 

35 

GCTGTATTGG TTCGTTATGG AGATACAGTC 
CCTCGTGATG GAGATTTCTT CCCATTAACA 
GGTAAAATTC CTGGTGGATT TAAAAAGAGA 

40 

ACTGCGCGAT TAATTGATAG ACCAATTAGA 
GTTCAAATTA TGAACATGGT ATTAAGTGCA 
ATGATTGGTT CATCTATGGC GCTTAGTGTG 
GGTGTAAATG TGGGTTATAT TGACGGTAAA 
GAAGTTTCTC GTTTAGACCT TGAAGTAGCT 
SO GCAGGCGCTA GTGAGATTAC TGAACAAGAA 

GAGATTCAAC GTTTAGTTGA TTTCCAACAA 



TAAATTATAT CGAGGGGTAG CTAACATAGG XS380 

AGCAGAAGTT GTCATCGAAG TGAATATCTT 1S440 

AGTGACCGTG AATTGGCATC ATTTCTTACG 16500 

ATTAGTTAAA CAAATGAACG ATGATAAATC 16560 

TGGTGATGAA GTAGCTTATA ATATCTAGAG 16620 

ACACCTTTTT CTTAGTAGGT CGAATCTCCA 16680 

CATTTTAAGG AGGAAATTGA TTATGGCAAT 16740 

AGAATACCGT GTACACGAAA CTGATACTGG 16800 

TGCAGAAATC AACGCaGTAA ACGAACACTT 16860 

TCGTGGATTA TTAAAAATGG TAGGTCGTCG 16920 

GATATTCAAC GTTACCGTGA ATTAATTAAA 16980 

AACGTCTTTG AGGTTGGGGC ATATTTATGT 17040 

TTACAAATAT TAACATTTAT TATATGTTAA 17100 

TGAGATAAAG ATGATATAAG TACACCTAGA 17160 

GTTTTTTTAA AAAATATAAC TTATATTTAT 17220 

TGTAAATAAT AGATGGATAT CCCGCTCTCT 17280 

ATTAAAATAC GATAATAAAT GATATGATAT 17340 

ATGTCTCAAG AAAAGAAAGT TTTTAAAACT 17400 

ACAGGGCAAT TAGCTAAACA AGCAAATGGC 17460 

GTGTTATCGA CGGCAACTGC ATCAAAAGAA 17520 

GTGAACTATG AAGAAAAAAT GTACGCTGCG 17580 

GAAGGACGTC CTGGTGACGA TGCAACATTA 17640 

CCTTTATTCC CTAAAGGATA TAAGCATGAT 17700 

GATCCTGATT GTTCACCACA AATGGCTGCA 17760 

TCGGATATTC CATTCCAAGG GCCAATCGCC 17820 

TATATCATTA ACCCAACAGT AGAAGAAAAA 17880 

GGTCATAAAG ATGCGGTAAA CATGGTAGAG 17940 

ATGTTAGAGG CGATTTTCTT TGGTGATGAA 18000 

CAAATCGTCG ACCACATTCA ACCTGTTAAA 18060 
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GAAGAAAAAG GACTTAAAGA AACAGTTTTA 
CTTGATAACT TAAAAGAAGA AATCGTCAAT 
^ GAaTTACTTA TTAAAGAAGT TTATGCAATT 

CGTTTAATTG CAGATGAAAA AATTAGACCA 
TTAGATTCTG AAGTTGGTAT TTTACCTAGA 

10 

CAGACTCAAG CACTTTCAGT TTTAACATTA 
GGTTTAGGAC CTGAAGAAGA AAAAAGATTC 

^5 GTAGGTGAAA CTGGTCCAGT ACGTGCGCCA 

GGTGAAAGAG CATTAAAATA TATTATTCCT 
ATTGTAAGTG AGGTACTTGA ATCAAATGGT 

20 ACATTAGCAT TAATGGATGC GGGCGTACCG 
GGCCTTGTTA CACGTGAAGA TAGCTATACG 
GCATTAGGTG ATATGGACTT TAAAGTCGCT 

25 

ATGGATATTA AAATTGACGG TTTAACGCGT 
AGACGTGGTC GTTTAGAAAT AATGAATCAT 
GAATTAAGTG CTTACGCGCC AAAAGTTGTA 

30 

GATGTTATCG GACCTGGTGG TAAAAAAATT 
TTAGATATTG AACAAGATGG TACTATCTTT 
35 CGTGCTCGTG AAATCATTGA GGAAATTACA 

GCCACTGTTA AACGTATTGA AAAATACGGT 
GCGTTGCTTC ACATTTCACA AATTTCAAAA 

40 

AAAATCGGTG ACACAATTGA AGTTAAGATT 
GCTTCACATA GAGCATTAGA AGAATAATAT 
TGTGATTTTT TTATGCCACT TTTTACGAAG 

45 

TTTTAAAACG CTTTATTATT TTGTGTGCAA 
ATAGTGTACA TCAAGTGTTT TTTAACTTAT 
so AACAAATTTA GGAGGTAAGA TTTTGAGTTT 
TATACCATTA GGCGGTGTTG GCGAAATTGC 
TGAAATGTTT ATGTTAGATG CTGGACTTAT 

SS 
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ACATTTGATA AACAACAACG AGATGaAAAT 18180 

GAATTTATCG ATGAAGAAGA TCCAGAGAAT 1824 0 

TTAAATGAAT TAGTGAAAGA AGAAGTTCGA 18300 

GACGGCCGTA AACCTGATGA AATCCGTCCA 18360 

ACGCATGGTT CAGGTCTATT TACACGTGGT 18420 

GGTGCTTTAG GCGATTATCA ATTAATTGAT 18480 

ATGCATCATT ACAACTTCCC GAATTTTTCA 18540 

GGTCGTCGTG AAATTGGACA TGGTGCX3TTA 18600 

GATACTGCTG ATTTCCCATA TACAATTCGT 18660 

TCATCATCTC AAGCGTCAAT TTGTGGATCA 18720 

ATTAAAGCAC CAGTTGCTGG TATTGCTATG 18780 

ATTTTAACTG ATATCCAAGG TATGGAAGAT 18340 

GGTACTAAAG AAGGTATTAC AGCAATCCAA 18900 

GAAATTAXCG AAGAGGCTCT AGAACAAGCG 18960 

ATGTTACAAA CAATTGATCA ACCACGTACT 19020 

ACTATGACAA TTAAACCAGA TAAGATTAGA 19080 

AACGAAATTA TTGATGAAAC AGGTGTTAAA 19140 

ATTGGTGCTG TTGATCAAGC TATGATAAAT 19200 

CGTGAAGCGG AAGTAGGTCA AACTTATCAA 19260 

GCGTTTGTAG GCCTATTCCC AGGTAAAGAT 19320 

AATAGAATTG AAAAAGTGGA AGATGTATTA 19380 

ACTGAAATTG ATAAACAAGG TCGAGTAAAT 19440 

TTAAAGTCAT ATGACGACAA TGTATCGTCA 19500 

TGACCCGTTT TGAATTTGTT GTATTGAACA 19560 

CTGTTAATTA TCCTGTATGT ATAGTGATTA 19620 

AATGAATAGT GAGTTTATAT ATGGACGGGT 19680 

AATAAAGAAA AAGAATAAAG ATATTCGCAT 19740 

TAAAAATATG TATATCX3TTG AAGTAGACGA 19800 

GTTTCCAGAA GACGAAATGC TAGGTATTGA 19860 
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CCTTACACAC GGACATGAGC ACGCGATTGG TGCAGTGAGT TATGTTTTAG AACAATTAGA 19980 

TGCACCAGTA TATGGATCTA AATTGACAAT AGCGTTAATT AAAGAAAATA TGAAAGCCCG 20040 

TAATATTGAT AAAAAAGTTC GCTACTATAC AGTTAATAAT GATTCAATTA TGAGATTCAA 20100 

AAACGTGAAT ATTAGTTTCT TTAATACGAC ACACAGTATT CCTGATAGTT TAGGTGTTTG 20160 

TATTCACACT TCATATGGTG CCATTGTGTA TACAGGTGAA TTTAAGTTTG ACCAAAGTTT 20220 

ACATGGACAT TATGCACCAG ATATTAAACG TATGGCAGAG ATTGGTGAAG AAGGCGTATT 20280 

TGTCTTAATC AGTGATTCTA CTGAGGCAGA GAAACCTGGA TATAATACTC CGGAAAATGT 20340 

GATTGAACAT CATATGTATG ATGCTTTTGC AAAAGTGCGA GGTCGCTTGA TAGTTTCATG 20400 

TTATGCTTCG AACTTTATAC GTATTCAGCA AGTTTTAAAT ATTGCTAGCA AGCTAAATCG 20460 

TAAAGTGTCA TTTTTAGGAA GATCACTTGA AAGTTCATTT AATATTGCTC GTAAAATGGG 20520 

GTATTTCGAC ATTCCTAAAG ATTTGCTAAT TCCTATAACA GAAGTTGATA ATTATCCTAA 20580 

AAATGAAGTG ATAATTATAG CTACTGGTAT GCAAGGAGAA CCTGTAGAAG CCTTAAGTCA 20640 

AATGGCGCAA CATAAGCATA AAATTATGAA TATCGAAGAA GGCX3ATTCTG TATTTTTAGC 20700 

AATTACGGCT TCTGCTAATA TGGAAGTTAT CATTGCGAAT AcATTAAATG AGCtTgTtAC 20750 

GnCTGGCGCA CATATTATTC CAAATAACAA AAAGATTCAT GCTTCAAGTC ATGGTTGCAT 2O820 

GGAAGAATTA AAAATGATGA TTAATATTAT GAAACCTGAA TACTTTATTC CTGTACAAGG 20830 

TGAATTTAAA ATGCAGATAG CACATGCGAA GCTAGCAGCT GAAGCAGGTG TTGCACCAGA 20940 

AAAGATTTTC CTTGTGGAAA AAGGAGATGT CATTAATTAC AACGGTAAAG ATATGATATT 21000 

AAATGAAAAG GTAAATTCAG GAAATATTTT AATAGATGGC ATTGGTATTG GGGATGTAGG 21060 

AAATATCGTG TTGAGAGACC GTCATCTTTT AGCAGAAGAT GGTATCTTTA TTGCTGTTGT 21120 

AACCM-TAGAT CCTAAAAATA GACGTATAGC TGCGGGACCT GAAATTCAAT CTCGTGGGTT 21180 

TCTATATGTA CGTGAAAGTG AAGACTTATT ACGTGAAGCA GAAGAGAAAG TACGTGAAAT 21240 

AGTAGAGGCT GGTTTACAAG AAAAACGCAT AGAATGGTCT GAAATTAAAC AAAATATGCG 21300 

TGATCAAATT AGTAAACTAT TATTCGAAAG TACAAAACGT CGTCCTATGA TTATTCCAGT 21360 

AATTTCTGAA ATTTAATCAA AAAGTCATTA ACATAAAAGA GGTCAGAACA AGTCACTGAA 21420 

ATATAATGGT TGTCATGGAC AATTTACTTA TATTTTATGA TAGTCAATTG AAGGGGTAAC 21480 

GATTAATCTG TTATCTTAAG TAAATTGATA CATAGATGAT ATTGTTCTAA CCTCTTTCAT 21540 

CGTCTGTTTG GACTACATAT TCTAAACATC AAATAGGAAA TTATATATAA TAACGTCGTT 2 IS 00 

TTAACTAAGG CAACATAAGG AGGTGCGTCA ATTGGCACAA GCAAAAAAGA AATCGACAGC 21660 
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GATACGTTAT GTCATAGCTA TTTTAGTAGT TGTATTAATG GTGTTGGGTG TTTTCCAATT 21780 

AGGAATAATA GGTCGTCTAA TTGACAGCTT CTTTAATTAT TTATTTGGGT ACAGTAGATA 21840 

TTTAACATAT ATTTTAGTAC TCTTAGCAAC TGGTTTTATT ACATACTCTA AACGTATTCC 21900 

TAmaACTAGA CGAACGGCTG GTTCGATTGT ATTGCAAATT GCATTGCTAT TTGTATCACA 21950 

GTTAGTTTTT CATTTTAATA GTGGTATCAA AGCTGAAAGA GAACCTGTAC TTTCTTATGT 22020 

GTATCAGTCA TACCAACACA GTCATTTCCC AAATTTrGGT GGCGGTGTAT TAGGCTTTTA 22080 

TTTATTAGAG TTAAGCGTAC CTTTAATTTC ATTATTTGGT GTATGTATTA TTACTATTTT 22140 

ATTATTATGC TCAAGTGTTA TTTTATTAAC AAACCATCAA CATCGTGAAG TTGCAAAAGT 22200 

TGCACTGGAA AATATAAAAG CTTGGTTTGG TTCATTTAAT GAA 22243 

(2) INFORMATION FOR SEQ ID NO; 165: 

(i) SEQUENCE CHARACTERISTICS: 

{A) LENGTH: 5510 base pairs 
(3) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 165: 
TTATTAATnA TTAATATTTT TATTTTTAAA AATAAAGCGA GGAGCTATCA ATGGAACAAA 
TTACTTCTGC ACAAAATAAT AGAATTAAAC AAGCGAACAA GCTAAAAznAG AAACGTGAGA 
GGGATAAAAC TGGATTAGCT TTAATTGAAG GTGTGCATTT AATTGAAGAA GCTTATCAAA 
GTGGAATTGT AATTACACAA TTATTTGCAA TTGAACCGGC AAGATTAGAT CAGCAAATTA 
WCGCATACGC GCAAGAAGTT TTTgAAATAA ACATGAAAGT TGCTGAATCT XTATCAGGTA 
CAGTSACACC ACAAGGGTTT TTCGCAATCA TTGAGAAGCC GCATTATGAT ATTTCTAAAG 
CACAACAAGT ATTGCTCATC GATCGTGTTC AAGATCCTGG AAATTTAGGC ACATTAATTA 
GAACTGCGGA TGCTGCTGGA ATGGATGCTG TAATAATGGA GAAGGGTACG ACAGATCCTT 
ATCAAGATAA AGTGTTGCGA GCGAGTCAAG GTAGTGTTTT CCATTTGCCA GTTATGACAC 
AAGATCTCGA TACGTTTATT ACTCAATTTA ATGGTCCTGT TTATGGTACA GCACTTGAAA 
ACGCAGTGgC ATACAAAGAA GTTACTTCAA GTGATTCTTT TGCATTACTA TTAGGTAATG 
AGGGAGAAGG TGTTAATCCT GAATTATTAG CACATACTAC ACAAAATTTA ATCATACCTA 
TTTATGGTAA AGCTGAAAGT TTAAATGTAG CGATTGCAGG TAGTATTTTA CTTTATCATT 
TGAAAGGTTG ACCGTGTTGA AAGTTTTCCG ATATAATTAT AATTAATTGT TTAACAGAAC 



60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
840 
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ATAAATAATT GTTTTAGGGA GAATAATCGT GACTGCAAGT TATTCCAATT ATTTAAAGTC 960 

TTTTCACCTT TTTGGTTACT TAAAGAGATT TAAGTCGGAA AGACAATCCG TTATCAATAT 1020 

TAAACAAGTG TATGCTTAGG CATAAATTTG GGTGGTACCA CGGAAATGAC TTTCGTCCCT 1030 

TATnTTTAA GAGGATGAAA GTCTTTTTTT AGTTAAACAA CAAATATGAT AAATAGAAAA 1140 

TGAATAGTTC GAATAGGGAG GTCAGTGACA TATGTCTGAA CAACAAACAA TGTCAGAGTT 1200 

AAAACAACAA GCGCTTGTAG ATATTAATGA AGCAAATGAT GAACGTGCAC TGCAAGAAGT 1260 

TAAAGTGAAA TACTTAGGTA AAAAAGGGTC AGTTAGCGGA CTAATGAAAT TGATGAAGGA 1320 

TTTGCCGAAT GAAGATAAAC CTGCGTTTGG TCAAAAAGTG AATGAATTGC GTCAAACAAT 1380 

TCAAAATGAA TTAGATGAAA GACAACAGAT GTTAGTTAAA GAAAAATTAA ATAAGCcAAT 1440 

TGGcTGAAGA AACAATTGAT GTATCATTAC CAGGTCGTCA TATTGAAATC GGTTCAAAGC 1500 

20 ATCCATTAAC ACGTACAATA GAAGAAATTG AAGACTTATT CTTAGGTTTA GGTTATGAAA 1560 

TTGTGAATGG ATATGAAGTT GAACAAGATC ATTATAACTT CGAAATGCTG AATTTACCTA 1620 

AATCACACCC TGCACGTGAT ATGCAAGATA GTTTCTATAT TACGGATGAA ATTTTATTAC 1680 

25 GTACGCATAC ATCACCAGTG CAGGCACGTa CGATGGAATC ACGTCATGGT CAAGGTCCAG 1740 

TTAAAATTAT TTGCCCTGGT AAAGTGTATC GTCGTGACTC TGATGATGCG ACACATAGTC 1800 

ATCAATTTAC ACAAATCGAA GGATTAGTTG TTGATAAAAA CGTTAAAATG AGTGATTTGA 1860 

AAGGTACTTT AGAATTGTTA GCTAAGAAAT TATTTGGTGC TGATCGTGAA ATTCGTTTAC 1920 

GTCCAAGTTA CTTCCCATTC ACTGAACCTT CTGTAGAAGT TGATGTGTCA TGTTTTAAAT 1980 

GTAAAGGAAA AGGTTGTAAT GTGTGTAAAC ACACAGGATG GATTGAAATT TTAGGTGCTG 204 0 

GAATGGTACA TCCTAATGTA TTAGAAAXGG CTGGTTTTGA TTCTTCAGAG TACTCTGGAT 2100 

TTGCATTTGG TATGGGACCA GACCGTATTG CAATGTTGAA ATATGGTATA GAAGATATTC 2160 

40 GTCATTTCTA TACTAATGAT GTGAGATTTT TAGATCAATT TAAAGCGGTA GAAGATAGAG 2220 

GTGACATGTA ATGTTGATAT CAAATGAATG GTTGAAAGAA TATGTAACAA TCGATGATTC 2280 

TGTAAGTAAT TTGGCAGAAC GTATTACGCG CACAGGTATT GAAGTGGATG ATTTAATTGA 2340 

CTACACAAAA GATATCAAAA ATTTAGTTGT CGGCTTCGTT AAGTCAAAAG AGAAACATCC 2400 

TGATGCTGAT AAATTAAATG TTTGCCAAGT TGATATCGGA GAAGACGAAC CTGTACAAAT 2460 

CGTTTGTGGT GCACCGAACG TTGaTGCAGG ACAATATGTC. ATTGTTGCTA AAGTAGGTGG 2520 

SO 

CAGATTGCCT GGTGGTATTA AAATTAAGCG TGCCAAATTA CGCGGTGAAC GTTCAGAAGG 2580 

TATGATTTGT TCGTTACAAG AAATTGGTAT TTCAAGTAAC TATATACCGA AAAGTTTTGA 264 0 
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ATATTTAGAT GATCAAGTAA TGGAATTTGA TTTAACGCCG AATCGTGCAG ATGCTTTAAG 2760 

TATGATAGGT ACTGCTTATG AAGTTGCAGC ATTATATAAT ACAAAAATGA CTAAGCCAGA 2820 

GACAACATCA AATGAGCTTG ATTTATCTGC AAATGATGAA CTGACTGTGA CAATTGAAAA 2880 

TGAAGATAAA GTACCATATT ATAGTGCACG TGTTGTTCAC GACGTGACAA TTGAACCCTC 2940 

GCCAATTTGG ATGCAAGCAC GCTTAATAAA AGCGGGTATA CGTCCTATTA ATAATGTTGT 3000 

TGACATTTCA AATTATGTGT TATTAGAATA CGGTCAACCA TTGCACATGT TTGATCAAGA 3060 

TGCGATTGGT TCACAACAAA TTGTTGTTCG TCAAGCTAAT GAAGGCGAAA AAATGACAAC 3120 

ATTAGATGAT ACAGAACGTG AATTATTAAC GAGCGATATT GTCATTACTA ATGGACAAAC 3180 

TCCAATTGCA TTAGCTGGTG TTATGGGTGG CGATTTrrCA GAAGTTAAAG AACAAACATC 3240 

AAATATAGTG ATTGAAGGTG CTATTTTTGA TCCAGTTTCA ATTCGTCATA CATCAAGACG 3300 

20 TTTAAATTTA CGCAGTGAAT CATCTAGTCG TTTTGAAAAA GGAATAGCTA CTGAATTTGT 3360 

AGATGAAGCA GTCGACCGTG CATGTTATTT ATTACAAACT TATGCAAACG GAAAAGTGCT 3420 

AAAAGATAGA GTGTCTTCAG GAGAACTTGG TGCATTTATT ACACCAATCG ACATCACTGC 3480 

TGATAAAATT AATCGCACTA TTGGATTTGA TTTGTCACAA AATGATATTG TTACTATTTT 3540 

TAATCAACTA GGGTTTGATA CAGAAATAAA TGATGATGTT ATTACAGTGC TAGTACCATC 3600 

ACGTCGTAAA GATATTACAA TTAAAGAAGA TTTAATTGAA GAAGTTGCAC GTATATATGG 3660 

ATACGACGAT. ATTCCATCAA CGTTACCTGT CTTCGATAAA GTTACTAGTG GTCAGCTAAC 3720 

TGATCGCCAA TATAAAACTA GAATGGTTAA AGAAGTGTTA GAAGGTGCTG GATTAGACCa 3730 

AGCTATTACG TATTCGTTAG TTTCTAAAGA AGATGCTACT GCaTTTTCGA TGCAACAGCG 3840 

TCAAACAATT GATTTATTGA TGCCAATGAG TGAAGCGCAT GCGTCATTAC GTCAAAGTTT 3900 

ATTACCACAT TTAATCGAAG CGGCATCATA TAATGTGGCA CGCAAAAATA AAGATGTAAA 3960 

40 ATTATTTGAA ATCGGCAATG TCTTCTTTGC TAATGGAGAA GGTGAACTAC CAGAXCAAGT 4020 

TGAATATTTA AGTGGTATTT TAACTGGAGA TTATGTAGTC AATCAATGGC AAGGTAAGAA 4080 

AGAAACGGTT GATTTCTATT TAGCAAAAGG TGTCGTGGAT CGAGTATCTG AAAAGTTAAA 4140 

TCTTGAATTT AGTTATCGCC GTGCTGATAT TGaTGGATTA CATCCAGGTC GTACTGCTGA 4200 

AATCTTATTA GAGAATAAAG TTGTTGGTTT TATTGGTGAA TTACATCCAA TATTAGCAGC 4260 

TGATAATGAT TTAAAACGTA CGTATGTTTT TGAGTTGAAT TTTGATGCAT TAATGGCTGT 4320 

GTCGGTAGGT TACATTAATT ACCAGCCAAT TCCGAGATTC CCAGGCATGT CTCGTGACAT 4380 

TGCATTAGAA GTAGATCAAA ATATTCCAGC AGCTGATTTA TTATCAACGA TTCATGCACA 444 0 
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AAAAGGTAAA AAATCAATTG CAATACGTTT AAATTATTTA GACACAGAAG AAACATTGAC 4560 

AGATGAGCGC GTTTCAAAAG TACAAGCGGA AATTGAAGCA GCATTAATTG AACAAGGTGC 4620 

TGTTATTAGA TAATGATTTA AACCCCATGT ATAAGGATAT CTGAAGTAGA TTGATATCCC 4680 

TAACATGGGG TTTTATTTTT GGGTTCACCA ATTTGGTTCC AATGCATTTA AAAAGTCAAA 4740 

GAGGAACAGC GGAATACAGA TGATGcTTCG CACAACTGCA TAAAAGCCTC TAATGATTAA 4800 

AAATCAAAGA GGCTTTAAAA TTTTTTGGGC TTTTTCACGA TTTTTAAAAT GCTTTTTTGA 4860 

AATGGTATCT AAACGTGAAA GACCGTATTT TTTTATAATT TTGGCGGCGA TTACATCGAC 4920 

TTTAGCACCG GCACCTTTAG GAATCGTCAT ATTAATATTT TTTGATATTT GATCCATATA 4980 

TGTAACAAAT GCGTATCGAG AAATTATGCT TGCCACTGCA ATGGCTAATG ACTTCGATTC 5040 

TCCTTTTGTT TCAAATTTTG TTTTCTTTGG AAGTGGTATA TCTGATAATG CGTAATGGCT 5100 

20 ATACACTTCG CGTTTTGCGA ACTGATCAAT GACGATATAG TCTAATTGAG ACGAATCAAT 5160 

TTTTTCAAGT ACATTTTTGA TGGCTTCATT ATGAAGGGCA GCTTTCATTT TTACTTGAGT 5220 

CCAGCCTTTT GCTTGCTGAA TATTATATTT TTCATTGTGT AGTGTTAATA ATGAATGTGG 5280 

TATGAAAGTA ACCAATTGCT CAGCAAGTTC TACAATTTTG GTATCGGTTA ATTTTTTTGA 5340 

ATCATCTACA CCCAAAGTTT TTAAAATAGG GACATGCTCT TTGGTAACGA AAGCAGCACA 54 00 

CACAGTCAAC GGACCAAAGT AATCGCCACT TCCAGCCTCA TCACTACCAA TACAGTTAAA 5460 

TTGrTCATAC ATTAaAGTTg TcCAgAAAAG AATTAGCCAT ATTTnCCTTT 5510 
(2) INFORMATION FOR SSQ ID NO: 166: 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 9623 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 166: 

GnTTATACTT ATAAATTTTA CGGGGGTAAT ATAATACTtA TTTACCTGTA ATATATGATA 60 

ATTCTTCAGC GGCAGCTGCG TTGATAGTTC TATGAGAAAT GATACCTAAT CCTTTAACAT 120 

TGGATTCTGA AATAACGATA GAACCATCAC TGTTAACTTT TTCAACAAAT GCTACATGAC 180 

CGTAATGTTG ATCTGCACCA AATTGTCCAG CCTCAAATAC AACAGCAGCA TGACGTTTTG 240 

GTGTATGACT TACTTGATAA TCACGGTATT GAGCTCGATT ATTCCAATTA TGTGCATCAC 300 

CTAAATCACC TGAGATAGAT GTACCAAATT GTTTCATACG GTTATATACG TACCAAGTAC 360 
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ATGAATCATC ATAATCCTTG ATAGAACGTT CATATTTATC TAAATCTGGC ATGCGTTCAT 480 

CGTCAAACTG AGTTAATTGA TAGTCITTAA TAATACTGTT TAATTTCTTA GCATAGTTTG 540 

GATCTGTAGC ATATGTTTTA GATAAGTGTG ATGTTGCATC TTTATAAGAA TCGGCTTCCG 600 

ATTTCCATGT TGGTTTATAA ATTGTTCGAT TGCCATCAAT ACCATTTTTA ATAAGGTCAG 660 

AGTAATCTTT TAGTGATTCT TTCGTGCTTG GATATTTTCG GAATCCAGCA TTAATACTAT 720 

ACAATTGATT ACCATCAGCT TC7AATGTGT TAAAAGGAAC AGAATTCCCT TCaAAAGCAC 780 

CTTTGATACC GAATAAATTA TGGTTTGGTG ACwTAGCTAA AGCACTACGA CCTGAGTCAG 840 

■ 

ATTCTAAGAT TGCTTGGGCA ATCATGACAG ACGCATAAAT ATCGTTATCT TGACCAATGC 900 

GATGTGCATC TTTAGCAATT GATTTGACAA ATTGACGTGT ATCTTTTGAG TCAACAACGT 960 

TAAATTGTCC GCTATCATCA TTGTTAGATA TACTAGGATC TGTTTCGAAT AATGATGTTG 1020 

20 CACGTGTATC CTTTTGATTA ACATCGTTAT TGAATGATTG AGCAGGTTTA GATTTATGTT LOBO 

TCAATTCATC TTGTGTTG6T AACTGTGGAT TCTTTGTATT AGATTTTTCA TTTTTGTCTT 1140 

TTTTAGATTG AGATGCATAA TCTTTTTGTG TITTCTTTGC ATCTTCACTG TATTGATCCA 1200 

AAATAGAGTC TAAAGCCGAA TCTGACATTG ATTGATTATC TTTCGATGAA GATTTTTGAT 1260 

TTGCTTTATC GTCACTTGCT GGTTGACTAT TTGATTGATT AGGTTGTGTT GGCTTTGGCG 1320 

AATTTGGTTG CTTATTAGAT GTACTTGGTT TTGTATTGTT TGATTTAGGT GCTTTTTGAT 1380 

TGTCTGCTTT ATCTTGTTTA GATGATTGCG TATCAGTGTC ATTTTTGATG CTATTGTCAC 1440 

TGTTTTTATT CGAATCATTT GTTGACTTTT CGCCATTACG AGGTTGTTCG TAATCAGAAA 1500 

TATCCGAATT TAAATTGAAT AAGTTTTGGA TTAAAGTTGT TAATGAGTAA TTATCATCGT 1560 

ATTTATTTTT GGTTAGCAAT TGGTTTATAT TGGTTTGTGG TAAATTCTTA TAAATAAAAT 1620 

CAAtSATATT GTTAGAGTCT GAAGTGCTGT CX3TCTATAGT TTTAAATTTT TTGTCGTTAT 1680 

40 TGTCTTGGTT ACTTGTATTA TTTTTGTCTG CTTTATCAAT ATCTTTACTT GTAGTATCCT 1740 

TAGAAGTTTC ATCGTCATTA GATTTTTTTG AATCATGAGA TGTTGTCTTA GCTGTAGTAT 1800 

CTTTTTGAGG TGTATCAGCA TAAGCGgXAG GTGAAaCTAA AGTAGGTAAT ACGAGCGTAG 1860 

TTGATAGCAA ATAAATTAAA ATTTTATTTT TAGGCATATT TCGTATTCTC CCTTGAAAAA 1920 

TATAATAATT AAGTGTGATA ATAAACTATG ATTTGTTATA ATTTATCGTA TGCTGAAAAT 198 0 

AGTTGATAGG TATCAATCGA CTAAATATCT TCCAGTAAAT TGATTATACT AATTCACAAC 2040 

GCAAAAATAA ATTAATTTAC AAAAAATATA TAAAAAATAT GAATAATTCC TACATAGGAG 2100 

TGTGACAATG AAGAACGCAT TTAAATTATT TAAAATGGAT CTGAAGAAAG TAGCTAAGAC 2160 
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TAACTTATGG GCAATGTGGG ATCCATATGG CAACACGGGA CACATCAAGG TCGCAGTCGT 2280 

TAATGAAGAT AAAGGCGACA CAATCAGAGG GAAAAAAGTT AATGTCGGTA ATACGATGGT 2340 

TAATACACTC AAGAAAAATA AAAGTTTrGA TTGGCAGTTT GTAAGTAGAG AGAAAGCTGA 2400 

TCATGAGATA AAAATGGGTA AATATTTTGC AGGTATTTAC ATCCCATCTA AGTTTACACA 2460 

TGAAATTACA GGGACACTAC GTAAGCAGCC TCAAAAAGCA GATGTAGAAT TTAAGGTGAA 2520 

TCAGAAGATT AACGCTGTTG CGTCTAAGCT AACAGATACT GGTTCGTCAG TTGTCGTTGA 2580 

AAAAGCGAAT GAACAATTTA ATAAAACAGT AACTCGAGCA TTATTAGAAG AAGCTAACAA 2640 

AGCAGGTTTA ACTATTGAAG AAAATGTGCC GACAATTAAC AAGATAAAAA ATGCGGTATA 2700 

TTCAGCAGAT AAAGCTTTAC CTAAGATTAA TGACTTTGCG AATAAAATTG TATATTTGAA 2760 

TAACCACCAA GCGGATTTAG ATAAATATGC CAATGATTTT AGAAAACTAG GAAATTATAA 2820 

20 AGGTGATATT TTAGATGCTC AGAAAAAATT AAACGAaGTC AATGGTGCTA TTCCGCAACT 2880 

TAATGAAAAG GCTAAGTTGA TATTAGCTTT AAATAATTAT ATGCCGAAAA TTGAAAAAGC 2940 

GTTAAATTTT GCAGCTGATG ACGTGCCAGC GCAGTTCCCT AAAATTAATC AAGGACTTAA 3000 

CATTGCGAGT CAAGGTATTG ATCAAGCTAA TGGACAGTTA AATGATGCCA AAGGCTTCGT 3060 

CACACAAGTT AGAAGTAGAG TCGCTGATTA TCAAGATGCA ATTCGACGCG CGCAAGATTT 3120 

AAATCGAAGA AACCAGCAAC AGATTCCTCA AAATAGCGCG GCGAACAACG AAACATCAAA 3130 

TAGTGCACCT GCAGCTGGTA ATGGTGTAGC ATCAACGCCA CCAAGTGCAC CAAGTGGCGA 3240 

TACTGCACCA AATAATAATG TTACGCAAAA TACCGCACCA AATAGTAATA ATGCGCCTGT 3300 

ATCGACTACA CCACAAAGTA CAAGCGGGAA AAAAGATGGT CAAAGTTTTG TAGATATAAC 3360 

AACAACACAA GTCAGCACAG CTAACGAGAA CACACAAAAC ATTACAGATA AAGATGTTAA 3420 

ATCAiCrGGAA GCGGCATTAA CGGGCTCTTT ATTATCATTA TCAAATAATT TAGATACCCA 3480 

40 AGCGAAAGCC GCACAAAAAG ATAGTCAGGC ATTACGTAAT ATTTCGTATG GGATTTTAGC 3540 

ATCGGACAAG CCTTCTGATT TTAGAGAGTC TTTAGATAAT GTTAAGTCCG GTTTAGAATA 3600 

CACAACGCAA TATAATCAAC AATTTATCGA TACATTAAAA GAGATTGAGA AGAATGAAAA 3560 

TGTTGATTTA TCAAAAGAAA TTGATAAGGT AAAAGCAGCT AATAATCGAA TTAATGAATC 3720 

ATTAAGGTTA GTTAATCAAT TAAGCAATGC ATTAAAGAAT GGTAGTTCAG GAACTGCTGA 3780 

AGCTACTAAA TTACTAGATC AACTTTCAAA ACTAGATTCA TCATTATCAT CATTTAGAGA 384 0 

TTATGTTAAA AAAGATCTTA ACAGCTCTTT - AGTATCAATA TCACAACGTA TTATGGATGA 3 900 

ATTGAACAAA GGGCAAACTG CATTATCCAA TGTTCAGTCT AAATTAAATA CAATTGATCA 3 960 
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AACAGTATTA CCAAGTATTG AACAACAATA CATTAGTGCT GTTAAAAATG CTCAAGCAAA 4080 

CTTCTCGAAA GTGAAAAGTG ATGTAGcTAA AGCTGCTAAC TTTGTGCGCA ATGACTTACC 4140 

ACAGTTAGAA CAGCGATTAA CTAATGCGAC AGCAAGTGTG AATAAAAATT TACCAACGTT 4200 

ATTAAATGGT TATGATCAAG CGGTAGGATT ACTAAATAAA AATCAGCCAC AAGCGAAAAA 4260 

GGCTTTATCA GATTTAGCTG ATTTTTCTCA AAATAAATTG CCTGATGTTG AAAAAGATTT 4320 

GAAAAAAGCG AAXAAAATTT TCAAGAAATT AGACAAAGAT GATGCAGTCG ACAAATTAAT 4380 

CGACACACTT AAGAATGATT TGAAAAAGCA AGCGGGTATT ATTGCAAATC CTATTAATAA 4440 

^5 GAAGACTGTT GAT6TTTTCC CAGTTAAGGA TTATGGTTCA GGTATGACAC CATTCTATAC 4500 

TGCACTGTCA GTATGGGTAG GTGCACTCTT GATGGTAAGT TTATTAACGG TTGATAATAA 4560 

ACATAAGAGT CTAGAGTCAG TCTTAACGAC AAGACAAGTG TTCTTAGGTA AGGCAGGATT 4620 

20 CTTTATAATG CTTGGTATGT TGCAAGCACT CATTGTATCG GTTGGAGATT TGTTAATCCT 4680 

AAAAGCAGGA GTTGAGTCAC CTGTATTATT TGTACTTATA ACGATTTTCT GTTCGATTAT 4740 

TTTCAACTCA ATCGTATATA CGTGCGTATC ATTACTTGGT AACCCAGGTA AAGCCATTGC 4800 

AATCGTATTG CTTGTATTAC AAATTGCAGG TGGTGGGGGA ACATTCCCAA TTCAAACTAC 4860 

GCCACAATTT TTCCAAAACA TTTCGCCATA CTTACCATTT ACGTATGCAA TTGATTCATT 4920 

ACGTGAAACA GTAGGCGGTA TTGTTCCGGA AATCCTAATT ACAAAATTAA TTATATTAAC 4980 

GTTATTTGGT ATAGGATTCT TCGTTGTAGG TTTAATTTTA AAACCTGTAA CAGATCCATT 5040 

GATGAAGCGC GTATCTGAAA AAGTTGACCA AAGTAACGTT ACAGAATAAA AATTAAATCC 5100 

35 ACACATTAGG GTTATAGCTC CTTAATGTGT GGATTTTTAT GTTTTTAGAC AGAAGAGATA 5160 

GTAATTTCTG TCTTTTATGG GACGGTTGTT ATCATTGCTA TTATCCAGGA TGACTTACTA 5220 

TAGcSlCTAAT ATTACCGACA AAGTGAATAT CCTCGTCTTC CGTAGTTAAA ATAAAGCTAG 5280 

AACCTTTTTG GATGTCATAG TGCTTATCGT TTACTGTTAA AGTACCAGTA CCATCGATAA 5340 

TTGTAACTAA GCAATAAGCA TGTGGTTTAT TGAATTTTAA. ATCTCCATGA ATATCCCATT 5400 

TATATACTGC AAAATATTGA TTATCTACAA ATTGAGTTAC AGTGtXSTGTG TCGATGTGAG 5460 

TTGTTATAGG AGTAGTATTT GGTTCATGAT TGCCTAATTC AATCACATCT TTACTTTGCT 5520 

CTAAGTGCAA ATCACGCAAT TGACCATTTT GATCTCGTCT ATCATAGTCA TAAATACGGT 5580 

ATGTCGTATC GGAGGATTGT TGTGTCTCTA AAATTAAAAT ACCCGAACCA ATGGCATGGA 5640 

CAGTGCCAGC AGGAACATAA TAAAAGTCAC CGGGCTTAAC AGGTATACGT TTGAAAAGAC 5700 

TGTCAAATTC ATGATTATCA ATCATGTCTA TTAACGTCTG TTTATTATGT GCATGTACGC 5760 
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GTTCGCCTTC GTGTTTTAAA GCGTAGTCAT CATCTGGGTG AACTTGAACA GATAATTTAT 
CATTGGCATC TAATACTTTA GTTAGCAGAG GGAAACTATC TCGTGAATCA TTATCGAATA 
ATTCACGATG TTGTGACCAA AGTTGATCTA GGGTCATATC CTTGTATGGA CCATTGATAA 
TTGTATTAGG ACCATTTGGA TGTGCAGAAA TTGCCCAGCA TTCACCAGTT GTTTCATTAG 
GGATATCATA GTTAAATGCT TTTAATGCAT GACCGCCCCA AATTCTGTCT TTAAAAACGG 
GTTGTAAAAA TAATGCCATA GTTAAAACTC CTCTATATTT TCATTAATAA GTTATAAATT 
TCTGTAGTAC TGTTTGCATT AATTAGTGAT TGGCGTGTCT CATCATTCAT TAACGCTTTA 
GATAAGCOCT GAAGTATTTT TAAATGTGTA TCCTGACTGT TGTTTGGTAC GGCAATTAAG 
AATATCAATT GAGGTAGACT ACCATCTAGA CTGTCCCATT TAACACCATG ArTATTTTTC 
ATAACAGCTA CAATCGGTTG TTTTACAACA TCAGACTTTG CATGTGGAAT GGCCACGTTC 
ATGCCAATAG CTGTCGTAGm tCcATTTCAC GTTCTAGTAT TGCATTTTTr AAATGCGATG 
TGTGCTCTAC ATAACGGCAA ATTTTAAGTT TATGAATCAA CATATCAATT GCTTCGTTTC 
GAGACATGTC GTGATCAGTA ATTATCATAG TTTGTTGATC AAAAACATGA GAAGGTTTAT 
TGAGATGTGA ATGTTTCGCG GTGTTATCTA CATTGTCAAC CTCTGTATCA TGTTGTGTAA 
TATCTGTATC ATGAAGTTGC GTGTGTTGCG CTGGTGCATC TACTGCTATA ACTGGTGTAT 
TGCGTTTTAA TAATAGTACA GTAGTCAITG TGACAAGACT ACCTACTATC ACTGCAAAGA 
TAAACCATAA TACATGATCA ATACCACCTA ATACAGCCAC GATTGGACCT CCATGTGCGA 
CTCTATCGCC GACACCACCA ATGGCTGCAA TGACTGATGC AATCATTGCA CCAATGATGT 
TTGCAGGTAT AATGCGCAAT GGATCTTGGG CTGCGAAAGG AATAGCACCT TCAGTAATAC 
CAAATAGTCC CATAGTGAAG GAAGCCTTAC CCATTTCTCT TTCGGAATGA TTGAATTTAT 
ACTTTTGAAC AAACGTTGCT AAACCTAAAC CGATTGGTGG TGTACATACA GCAACTGCGA 
CCATACCCAT AACGGCGTAA TTACCTTCAG CAATAAGTGC TGAGCCAAAT AAAAATGCTA 
CCTTGTTTAC TGGACCGCCC ATATCGAAGG CAATCATCGC ACCTATAATC ATCGCAAGTA 
TAATAATATT AGCACCTTGC ATACTTTTTA ACCAGGTTGr TAATGCCTCA AAAATATTAG 
AAATTGGTGC ACCGATTAAA AATATAAATA TCAATCCTAC AACGACCGAT GAAATAATGG 
GAATAATAAT GATAGGCATA ATTGGTGCCA TTGCTTTTGG AACTTTAATA TCTTTAATCC 
ACTTTGCGAT ATAACCTGCT AAGAAACCAG CAACAATACC ACCTAAAAAT CCTGCGCCTG 
CATCACTGCC ATAAAAACTA CCGTCAGCAG CGATAGCGCC GCCAATCATA CCAGGAACAA 
GACCGGGcTT GTCAGCGATA CTAACAGCGA TATATCCAGC TAGTATTGGA ACCATAAATT 
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ATCCTTTTGA TGTCGTTtCA CCGCCTAGAG TCAGCGCGAT GGCGATAAGG AGTCCACCAA 7630 

CTACGATAAA AGGAACCATA AACGATACAC CGTTCATTAA ATGTTGATAC ACCATTTGAA 7740 

TACCATTTTT AGACTTACCG CGATCTTTCG AATGATAATT TGTTTCAGAT TGATAAATAG 7800 

GCGCATCTTG ATTAATGA7A CGTTGAATTA GACCTCTCGG ATTATGAATC CCTTCGCGAA 7860 

CATTTTCATT AATCAACCGT TTACCAACAA ATCGGGACAG ATCAACTTGT TTATCAGCTG 7920 

CAATTATGAC ACCGTCAGCT TCTTCGATGT CTTGCGTAGT TAAAACATTT TCAGCACCAA 7980 

CACCGCCCTG TGTCTCTACT TTAATATCCA CACCCATTTC TTTTGCTACC TGCTCAAGCT 8040 

TTTCTTGAGC CATATATGTA TGTGCAATGC CATTTGGGCA TGAGGTAATA GCTACAATTT 8100 

TCATAAAATC ATCTCCTTTT CTATATTGTA AGCGTATTCT CGATACTAAA AAAAAGAATA 8X60 

ATTACCGTTA CTAGTGGCAA TTATTCTTGT AAGTATTCAA ATAACTGTTG CTTTAAACTA 8220 

20 TGATCATCTA AACTACATAA ATGGTTCACT GAATCATCAT CCAAGTTAGC AATTAATTGC 8280 

ATCATTTGTT TTGTAAAAGC TTTGTCTTTA TGCGAAATCG CTAAGAAAAA GACAAGTTTG 8340 

ACATCGTGTT GTCGCCAAGG AAAAACATCT TTTGTGCGAA AAATAAGCAC ATGTGATTGT 8400 

AAAACTTTTT CAGGATCTCC ATGAGGAATC GCCATAAAAT TACCTATGTA TGTAGAAGAT 8460 

GATTTCTCAC GCTCTAAAGC TGATTCGATA TATCCTTCTA CAATCGCATG ATGTGCTTGT 8520 

AATATTTTTT GAGCTTCTTC AAAAATTTGC ACAGTATGCC GTGATTTTTG TTCAGTATTT 8580 

ACGACAAGGA AATTGACAGT GTCCATATGA TGATGTGCTT GAACCGGATT TTGCTTTTGC 8640 

TTCACAACGT GTCTGATTTT G7GACGATCA TCTTCAGAAA ATAATGGTGC AACCTTGATA 8700 

GTCGTCAGGT GCTTAGGAAG TATGTTTAGC GTTTGTTTAG GAATATCATG GGTCGTTATT 8760 

AATAAATCTA CATTGTCAAA GTGATAGTGT GTTATATTTT CTAGTTTAAT CGTATTTATC 8820 

ACTGACAACT CTTCGGATAA GTTATTTATT TTAGXTTCTA AAAAATTCGA CACACCTAGA 3880 

40 CCATAATAAC AAGCAATGAC TACATTTAAT TGTGTTTTGG TACGACGCTC GATGGCAGCT 8940 

TGAAAATGAA TTGTTAAAAA TGCAATTTCA TCTTCGCTCA TCTCTATATC AGTATCAATT 9000 

GCTAATTTAT CAATCGCTTC AAAAAGTGTG TTAAACACAA AGGGATAGAG TTTTTTAATC 9060 

TCTATAACTA AAGGATTGTT TAAATAAAT6 TTTTGAGTGA TACGTAAATA TGCTTTACTA 9120 

AAATGATTAT ATAAMTTTG TTGTAAAATC GAATCTTCAT TGAAAGGTAC ATGAATACGT 9180 

TGCTGCATCA ATTCGATTAA GCGATCAATA TAACTTTGTA TAAATATACG TTCTATGCCA 9240 
ATATCGAGTT TATTAAAATG ATAAGCAATA AAGAATGAAA ACATATTGAT TACTTTTTCG " 9300' 

TTCAAGTCAT AACCTAATCT TTCGTTGATT TGCTTAATGC AAGATTGAGA TATCAATTTT 9360 
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AGATGAATTA AAAGCTGTTG TATTTGAATA TCAGTTGTTT CAATACTATG TTGTTGAAGT 
GTCTCTTGTA TAATATGCGA AATCATCCTT TGGTGTGAAT CAGGTAATTC aTTTAAAATT 
AGGTCTTCAA CATGTACATG CCCTGATGAT AATTGATTTA AATGGATGAT GGCATTAGTG 
ATATCATTAT CTGTTCCATC GAC 
(2) INFORMATION FOR S2Q ID NO: 167: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1021 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 167: 
ACCGTGGAAA CACGTCTAGT CAATCAGAAA GCGATAAAAA TGTGACTAAA TCATCTCAAG 
AGGAAAATCA AGCAAAAGAA GAATTACAAA GCGTTTTAAA CAAAATTAAC ' AAACAATCAA 
GTAAGAATAA TTAAAAAATT TTGATATTGT CTATGTTTAT AGTTCACAAG CCATTCAACG 
TATTGTAAAC TAAGGATAGT GTATTTTTTT AATAGTAATT TGTCAGGAGG TGCCTATCTA 
TGGAAGAACA TTACTACGTA AGTATTGATA TTGGATCATC AAGCGTAAAA ACAATAGTAG 
GCGAGAAATT TCACAATGGT ATAAATGTGA TAGGTACAGG ACAAACCTAC ACGAGCGGTA 
TAAAAAATGG TTTAATTGAT GATTTTGATA TTGCGCGACA AGCAATCAAA GACACAATTA 
AAAAGGCATC AATCGCTTCG GGTGTTGATA TTAAAGAAGT TTTCCTGAAA TTACCTATCA 
TTGGAACGGA AGTTTATGAT GAATCAAATG AAATCGACTT TTATGAGGAT ACAGAAATCA 
ACGGTTCACA TATCGAAAAA GTATTAGAAG GTATTAGAGA AAAAAATGAT GTGCAAGAAA 
CAGAAGTAAT TAATGTGTTC CCGATTCGTT TTATAGTCGA TAAAGAAAAT GAGGTTTCAG 
ACCCTAAAGA ATTAATTGCC AGACATTCAT TAAAGGTTGA AGCAGGCGTA ATTGCTATTC 
AAAAATCGAT TTTAATTAAT ATGATTAAAT GCGTAGAAGC ATGTGGTGTT GATGTATTAG 
ATGTTTACTC TGATGCATAT AACTATGGTT CAATCCTAAC AGCTACTGAA AAAGAGTTAG 
GTGCATGTGT CATTGATATT GGTGAAGACG TTACGCAAGT TGCTTTTTAT GAACGCGGTG 
AATTAGTAGA TGCTGATTCT ATCGAAATGG CAGGGCGTGA TATTACaGAC GATaTTGCAC 
aAGGrTTaAA CACTTCTnAT GAAACTGCTG nAAAAAGTTA AACACCAATn TGGTCATGCA 
T 

(2) INFORMATION FOR SEQ ID NO: 168: 
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(A) LENGTH: 7963 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

5 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 168: 

TAATCTATTA TAAT^CTGT CCATACCCTT TGATTACCTT CTCTTCAGGT ACAGGCCACA GO 

CTTGAGGCCA TAAGCCATAT GCTTGCTGTG AATAAAATTG TGCCATTTGT AACAATATAA 120 

TATATACAAA TAAACACCCA ATAATTGCTG TCACTAATGG ATATGATAAC CAAACCATTA 180 

15 ATAAAACTGC AATAATTACT AACCTAAAGA TAATATTAAA TGCGTCTCTC CCTCTTATAA 240 

AGCTTCTAAT AAATAAGAAT AAATACATCG CATTAGAGTT AAATTTACTA CCCTTTGGAA 300 

CTGGTAAAAG TATATCTAGA TAACTTCTTC TGACTGCAGA TTCTTTCAAA TGTTTTACAT 360 

CGGTGAACAT ATTAACAAAT TTATAATAAT TCATATGATG TCGATGTTCG ATTGCAATCA 420 

TTTTCTCCCA AGGATACAAA AAGCCTGGTT TATATTTTTT AACTAAAAAT TCTATTAACA 480 

CAGGCAAAGC AACCATCACA AATGCGATGT ACCATTTTGG AGCTAATAGT AAGTAATATG 540 

25 

TTAGAGCAAA GGTGATGAAT GATATTAAAT TAACTTGCCA TGTTTTAAGT CCCGATTGAT 600 

ACCATTGCCA TCTTAAGCGT AAACCAACAT ATGGAAAAAT TAATGCACTG ACTCCAAAAC 660 

AAATATAAAA TGCCACATTA TGTTGATTAA TATTGTAAAA CAACGGGAAC ATTACAATAA 720 

30 

CAATAATGAG TTGGATTAAT ATGCGCGCAA AGTAACTATA TAAAATCGCA TGACGCATAA 780 

ATTGAGACAT GTGTTTTTCA AATGGTAATA AAAAGATTTT ATCCgCTTCT TTTAACAGTG 840 

35 GTCsCmTTGG AAAAATAGrT GTCAACGCAA CAATCACTGC TGCTATTaAT GAAAAATTGa 900 
TATTCGTTGG AATATGTTTT AACCATTcAC CATATCCArA AATAAATGCA CCCAGCAAAA " 960 

TAAGTAAAAA GACCATGAAA TGACCATTAA ATATAAACTT ATTATAATAA TTTTtCTCTT 1020 

to 

^° TACGAAGGGC ATGTAATCTT ' TTATTAAATA ATGTGGTAGC TTGGTTACGC ATGTACATCT 1080 

CCACCTTGCG TCACATGAAT ATATATATCG TCTAATGTTT GATTATGTAA GCCAGTTTGT 1140 

TGTCTCAATG CTTCTAAATC TCCAAATGCA ACGACTTCAC CTTCGTCTAG TATGaTAAAA 1200 

45 

CGATCACAGT AACGTTCAGC TGTTGCTAAA ATATGTGTAC TCATTAGAAC GGTTCTACCT 1260 

TCGTTTTTCT TTTCAACCAT TAAATCTAAC ATGGATTGAA TTCCTAATGG ATCTAGGCCA 1320 

AGGAATGGTT CGTCTATAAT ATACAATTCG GGATTAACGA TAAACGCACA AATAATCATG 1380 

SO 

ACTTTTTGTT TCATCCCCTT AGAAAAATGA CTCGGAAAAA CTTTCAACTC ATTTTCTAAA 144 0 

CGGAATGTCT TTAATAATGG CATTGCTCGA TTCATCGTTT CATCACGATC AATATCATAT 1500 
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TCCGGAATAT AAGATAACTT TCTTCTATAA 
GAAATTGATA GAGATCCTTC CATAGGTGTA 
CTCTTACCAG CGCCAT7AAG GCCAATAAGT 
TTTATATCTT TAATTACAGG GCGTTTTCCA 
GTCATAAGGC ACCTCCATGA CTTATATTGT 
ACACATGTCC TAATATCGAA TTTTTAGCGA 
AAAAGGAGTG TAGTCATCAT GTCAGAAACA 
CCTAGCTTTA AAGTATATGA AGACGATTAT 
ACTAAAGGAC ATACGTTATT AATTCCTAAA 
GAAGAAACAA TGAAACATAT CGGTCCAGCA 
GCATTTAATC CTGATGGTTT AAACATTATT 
GTATTTCATA TTCATTTCCA CTTAATTCCT 
TATAAGTGGG AAACACATGA AGACATTTTA 
CAAAJTCAAG CACAATTTTA AATGTATGCT 
TAATATTATA ACAATTGCGT TTGAAGTGAT 
GAGTTATCAA GATAACAGAT GTTAAAAGTG 
CTATTCGGTA TCGGTGTTGG CGTAGCAGCT 
GACAAAAGTG TCAAGAACAA CACGATCGAT 
CTACAACGTG AATTTGAAAC GATTAAACAA 
CAAATTAAAA ACGAAAGTGC GGAATTTGGT 
CTT(^AAACT TCAAATCTGA CATTAATCCT 
AATTTACAAA ATCGTGGCGA GGATATTGGA 
TCGATCACAA CTATTTTTAT TAGTAACAGC 
AAACGAGATG ACATTAGAAA TTAGATATTT 
ACTXATGTTT ACAAATTATA GGAAGACATT 
TATGAATTGA TTGAAAACAT TGCTTAGGAT 
CTTTACTTAA ATCATTATCG ACAAACAACA 
ATACACATTA CATATACCTT ACTTGCACAA 
TATCACTATA TTTTTAGCAT TTGTATAACT 



GCCTCTATGT CATCATTAAT GTTGATATCT 
AGCAATCCTA GCATATGTTT AATCGTTGTA 
CCAACAATTT CGCCTTTGTT TAATTCAAAA 
TATCCACCTG TAAGCTGTTC TACTTTAACT 
ACCAAAAATT ATAAAATGCT CATATTAAAT 
CAATGTTATA ATGAATGGTA ATACTAGTTG 
ATTTTCGGGA AAATTTTAAC TGGAGAAATT 
GTCTATGCCT TTTTAGATAT ATCACAAGTT 
AAAGCTTCTG CTAATATCTT TGAAACTGAT 
TTACCTAAAG TAGCAAATGC TATTAAGCGT 
CAAAATAATG GTGAGTTTGC AGATCAATCT 
CGATACGAAA ATGATATTGA TGGATTTGGT 
GATAACGATG CAAAACAACA AATTGCTGAA 
TAATCTAAGC TCGAACGGGT ATAATATGAT 
AACATCAAGG TTAGCAATTT TAAACAAAAT 
AGGAGAATAT AAATGAAAGC ATCACGCATT 
GGTTTTGTAG TTGCACTTCA AGGACGTGAC 
CGTACTGCCC CTACTGGTTC AAAATCAGAA 
AGTTTTAATG ACATTTTAAA CTATGGTGTT 
AGTTCAATTG GTGGTGAAAT TAAGTCATTA 
AATATTGAAC GTTTACAGTC ACACATCGAA 
AACGAAATTT CTAAGTAGCA GGTTACGTTC 
ATATTTATTT TTTAAAATTA AATGCCAAAT 
CTTGTCATCT CTTTTTTAAA ACTCAAATGA 
GTTTGTAGTG ATTTTCGCTT AAATCATATT 
TCATTGTGTT ATCCtTGCAC TTTGATTACG 
TACTTATATT TTCATTGAGC CGAACCTTAT 
ATTATTAATC TGGTGTTTAT TATAATTACA 
TAGTTGGTCA AAAGATGCTT TTGCATATGC 
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TTTCATAAGT GATGCTTTAT TAGCAAGAAT ATGTGTTCGC AGAAATTTGT TCTGCATTCT 3420 

ACTTCTACGC TAGTCAATCA GACAATTTTA CCAATCCCCA CTTTCGCGTT TCAAATCAAA 34 80 

CAATACGTCG CTCCTTTCTT CTTATATAAC AATTCTTCTA ACATGATATG TTACTATTGA 354 0 

ATTACTGAAC CTGAGTTAGT TATAATCTAA CTTATATTGA AAAGAGATGA GGCGTAAGAT 3600 

ATGTTTTTAT GTAAAAGACA AATTGATATC AATGCACGAT TTGGTTTGCC TAGAATTGCA 3660 

TTTATGAGTG CAGTTGCAAC CATCATTATG TTTTTAGTTA GTTATGAAGT AATGTATTTT 3720 

TTATCTAATA CGCCATTATC AGATAGACAT TTTCTCATCT TTTTATTACT TGTATTTATG 37 BO 

ACGTATCCAT TACATAAAAG TATACATTTA TTATTTTTCT TACCATATAG AAAATCGTTT 3840 

AAAGTTCATA AGTTAACTAA AAGAAAATGG CTTATATTCT ATAATACCTA CGTCAATCAA 3900 
CCTGTACACA AATTTTATTT TTGCATTAAC TTAATATTGC CGTTAATTAT CTTATCTGCA . 3960 

ATGTTCGTTT ATCTAACAAT TTCATTCCCG CAATATGGAC ATTATTTTAT GTTCTTATTG 4020 

GCATTGAATT TCGGTATTTC CATTACAGAT TTATTATATT TAAAAATAAT TATATTTTCT 4030 

AATTATGGAC AATATATAGA AGAACATAGT ACAGGTATTA ATATTTTGAA AAAAATTAAA 4140 

25 AATCCATATC ATTTATAACA AAATAATTAT AGCAAGGTGT TATTATTTGT TTTTAGGCTA 4200 

TGTAATAgcT tACAATCAAA TGTATATAGA CCTTGTTTTT TTATTTTCAX CAATTTCTAC 4260 

CCCTAAACCT AATGCTCTAG TCTGATGTCA TGGGTTATTG ATTGGTGATA ATATAAAACT 4320 

30 ATGTTATATT CACGATGATT AACTTACAAA GGAGTTTCAA CTATGAAGAT GATAAACAAA 4380 

TTAATCGTTC CGGTAACAGC TAGTGCTTTA TTATTAGGCG CTTGTGGCgC TAGTGCCACA 4440 

GACTCTAAAG AAAATACATT AATTTCTTCT AAAGCTGGAG ACGTAACAGT TGCAGATACA 4500 
ATGAAAAAAA TCGGTAAAGA TCAAATTGCA AATGCATCAT TTACTGAAAT GTTAAATAAA . 4560 

ATTITAGCTG ATAAATATAA AAATAAAGTT AATGATAAGA AGATTGACGA ACAAATTGAA 4620 

AAAATGCAAA AGCAATACGG CGGTAAAGAT AAATTTGAAA AGGCCCTTCA ACAGCAAGGT 4680 

• TTAACAGCCG ATAAATATAA AGAAAATTTA CGTACTGCTG CTTATCATAA AGAATTACTA 4740 

TCAGATAAAA TTAAAATCTC TGATTCTGAA ATTAAAGAAG ACAGCArGAA AGCTTCACAC 4800 

ATTTTAATTA AAGTTAAATC TAAGAAAAGC GACmAAGAAG GCTTAGATGA TAAAGAAGCG 4860 

AAACAAAAAG CTGAAGAAAT TCAAAAAGAA GTTTCAAAAG ATCCAAGTAA ATTTGGTQAA 4920 

ATCGCTAAAA AAGAATCAAT GGATACTGGT TCAGCTAAAA AAGATGGCGA ATTAGGTTAT 4 980 

50 GTTCTTAAAG GACAAACTGA TAAAGATTTT GAAAAAGCAC TATTTAAGCT TAAAGATGGT 5040 

GAAGTATCAG AGGTTGTTAA ATCAAGCTTT GGATATCATA TTATTAAAGC TGATAAACCA 5100 
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AAAAATCCAA AATTATTGAC TGATGCATAC AAAGATCTAT TAAAAGAATA CGATGTTGAC 5220 

TTTAAAGATC GTGATATTAA ATCAGTTGTC GAAGATAAAA TCTTAAACCC TGAAAAACTT 5280 

AAACAAGGTG GCGCACAAGG CGGACAATCC GGCATGAGCC AATAACACAA AACCGAGCGA 5340 

CCGTGGTTCA AAAATCATAC CACGGCCGCT CGGTTTTTTC GCATTAAAAA TCGGACAGAT 5400 

GAGCTCATGT TTCAGTATAC TCATCTGTCC GATATCTTTT AATTCTTAAT CGAGTGATTC 5460 

AGGATTGTAG AATCTACGAT TTTCAAGACC AAATATTTTA TCTGTAAACT GACCCTTGTC 5520 

AGTTTTTTTA TATGCCTTTT CAAACATATT CATTCTAGCA TCGATATTAT CGATATAGCA 5580 

TAAAATTTCT GCTTCTTTTA AGTATGGCAG TTTTGGAGAA CCATACTCTA ACTTACCATG 5640 

ATGAGATAAA ATCATATGTC TTAACAACAT GATTTCTTCT CCTTCAATGT TCAATTCACG 5700 

AGCTGCTTCA ACTACTTCAT CACTCGCAAT CGAGATGTGT CCTAATAAGT TACCTTCGAC 5760 

TGTATACGAC GTCGCAACAG GACCACTCAA TTCTCTAACT TTACCAATAT CATGCAAAAT 5820 

AATACCACTA TATAACAAAC TTTTGTTTAA CAATGGATAA ATGTCaCAAA TTGATTTTGC 5880 

AATACGTAAC ATCGTTAATA CATGATAGCT TAAGCCACTC GCAAAGTTAT GaTGATGAGA 5940 

25 ACTAGCAGCT GGATATGTGT AAAATCGTTC TTGATATTTT TTCAATAAAT GACGTGTGAT 6000 

ACGTTGTAAA TTAGCATTTT CAATATCTAG CAAATAATGA GAAATCTCTT CTTGTATTTC 6060 

TGCCGGTGAT AAAGGTGCAC CATCTACAAA TTGTTCTGTT. TTTAATTGAT CTTCAGTTGT 6120 

CGCTAGTCTA ATTTGGTTGA CTTTCATCTG TTTATTTCCG CGATAGTTTA TGATGTCACC 6180 

TTTAACATGT ACAATTTCTT CAGGCTTGAT TGTTGCCATA TCATTTTTTG TAGCCGTCCA 6240 

AAATTTCGCT TCAATTTCAC CACTTTTATC TTGCAAATGT AATGTCATAT AATCTTTACC 6300 

TTGTGCTGTT ACACCCTGTG TAGCTTTATG CACTAAGAAA AAGTGATCAA CTGAATCTCC 6360 

GGG«TTAGA TTCTCTATAT TTCTCATCGT TTCCCGCCTT CCTCTATTTT GTTTAATGTA 6420 

ATCACTTCTT TTGATGGAAC AATATTATCT TTTACAGATG TAAAGTATAG TACTTGATAG 6480 

TGTTCTGATA ATGATCGTAA ATAATTCAAC ATTTTTTCAG TATOTTTTTT ATCAAAATGA 6540 

ACAAATGCAT CATCAACAAT TAATGGGAAC GGATAATATG GTCTTAGTAC CTTAATTAAA 6600 

CTGATACGTA AAGCTACATA AAGTAATTCT TTTGTAGATT GACTTAGTTC AACAGGATCA 6660 

TATAATTGAC CATTAACATG TTTAACCGTA ATTGAATCTT CATTATAGTT AATCATCGTA 6720 

TATCTGCCAT CTGTTAAATG CTTCAATATT TCTACCGCTT CATTAATAAC TTGAGGCAAA 6780 

SO CGTTTATCTT TAATTTGTTT AATGTGTTCA TCAACTAAAC TTTGTAAATA ACTTAAACTT 6840 

GCCCAATCTT TTGCGATATC ATTAAGTTGA nTTTAAGAC TGTGATATTC ATGTCTTAAA 6900 
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GAAGATGGTT TATTCGAAGT ATTACCTAAA AAAGAAGTAG TAGAACTTAA AAAAGAATAC 480 

GACCGTTTAA TCAAATTCTT AGGCGGAATT CGTGATATGA AATCAATGCC TCAAGCATTA 540 

5 TTCGTAGTTG ACCCACGTAA AGAGCGTAAT GCAATTGCTG AAGCTCGTAA ATTAAATATT 600 

CCTATCGTAG GTATCGTTGA CACTAACTGT GATCCTGACG AAATTGACTA CGTTATCCCA 650 

GCAAACGACG ATGCTATCCG TGCGGTTAAA TTATTAACTG CTAAAATGGC AGATGCAATC 720 

10 

TTAGAAGGTC AACAAGGCGT TTCTAATGAA GAAGTAGCTG CAGAACAAAA CATCGATTTA 730 

GATGAAAAAG AAAAATCAGA AGAAACAGAA GCAACTGAAG AATAATCAAC TGTTGAATCT 840 

GACTTAGATA TAGTTTAAAT GGGTGATAAG ATATTAATGC TTATCACCTT TTTTAAAAAG 900 

15 

AAAATCGAGG CAAATTACAA ATATTCAATT AGAGTATTGG CAATCTTGCC TATAATAATG 960 

CTAAAATCAT AATATATAAn ATGATAACTT ATTGGAGGAA TAATGAATGG CAACTATTTC 1020 

AGCAAAACTT GTTAAAGAAT TACGTGAAAA AACTGGCXJCG GGTATGATGG ATTGTAAAAA 1080 

AGCGCTAACT GAAACTGATG GTGACATCGA TAAAGCX3ATT GACTACCTAC GTGAAAAAGG 1140 

TATTGCTAAA GCAGCTAAAA AAGCAGACCG TATTGCGGCT GAAGGTTTAG TACATGTAGA 1200 

25 AACTAAAGGT AACGACGCAt TATCGTTGAA ATCAACTCTG AAACAGACTT TGTTGCTCGT 1260 

AACGAAGGTT TCCAAGAGTT AGTTAAAGAA ATCGCTAATC AAGTATTAGA TACAAAAGCT 1320 

GAAACTGTTG AAGCTTTAAT GGAAACAACT TTACCAAATG GTAAATCAGT TGATGAAAGA 1380 

ATTAAAGAAG CAATTTCAAC AATCGGTGAA AAATTAAGTG TTCGTCGTTT TGCTATCAGA 1440 

ACTAAAACTG ATAACGATGC TTTCGGCGCT TACTTACACA TGGGTGGACX3 CATTGGTGTA 1500 

TTAACAGTTG TTGAAGGTTC AACTGACGAA GAAGCAGCAA GAGACGTTGC TATGCATATC 1560 

35 

GCTGCAATCA ACCCTAAATA TGTTTCTTCT GAACAAGTTA GCGAAGAAGA AATCAACCAC 1620 

GAAAOAGAAG TTTTAAAACA ACAAGCATTA AATGAAGGTA AACCAGAAAA CATCGTTGAA 1680 

AAAATGGTGG AAGGACGTTT ACGTAAATAC TTACAAGAAA TTTGTGCTGT AGATCAAGmT 1740 

40 

TCGTTAAAAA CCCTGATGTA ACAGTTGAAG CTTTCTTAAA. AACAAAAGGT GGAAAACTTG 1800 

TTGACTTCGT ACGCTATGAA GTAGGCGAAG GTATGGAAAA ACGCGAAGAA AACTTTGCGG 1860 

45 ATGAAGTTAA AGGACAAATG AAATAATCTG TCATAAAGTA AAACAAGGAA GAAGACACCT 1920 

TTAATGTTGC TTTATTAAAA TGTAAATCAT TCTAATAAAA CGACAACTGT GTCTTCTTTA 1980 

CTTGTATATG TTACATATAT TCACGATAGA GAGGATAAGA AAATGGCTCA AATTTCTAAA 2040 

SO TATAAACGTG TAGTTTTGAA ACTAAGTGGT GAAGCGTTAG CTGGAGAAAA AGGATTTGGC 2100 

ATAAATCCAG TAATTATTAA AAGTGTTGCT GAGCAAGTGG CTGAAGTTGC TAAAATGGAC 2X60 
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TTAGGTATGG ACCGTGGAAC TGCTGATTAC ATGGGTATGC TTGCAACTGT AATGAATGCC 2280 

TTAGCATTAC AAGATAGTTT AGAACAATTG GATTGTGATA CACGAGTATT AACATCTATT 2340 

GAAATGAAGC AAGTGGCTGA ACCTTATATT CGTCGTCGTG CAATTAGACA CTTAGAAAAG 2400 

AAACGCGTAG TTATTTTTGC TGCAGGTATT GGAAACCCAT ACTTCTCTAC AGATACTACA 2460 

GCGGCATTAC GTGCTGCAGA AGTTGAAGCA GATGTTATTT TAATGGGCAA AAATAATGTA 2520 

GATGGTGTAT ATTCTGCAGA TCCTAAAGTA AACAAAGATG CGGTAAAATA TGAACATTTA 2580 

ACGCATATTC AAATGCTTCA AGAAGGTTTA CAAGTAATGG ATTCAACAGC ATCCTCATTC 2640 

TGTATGGATA ATAACATTCC GTIAACTGTT TTCTCTATTA TGGAAGAAGG AAATATTAAA 2700 

CGTGCTGTTA TGGGTGAAAA GATAGGTACG TTAATTACAA AATAAATTTA GAGGTGTAAA 2760 

ATAATGAGTG ACATTATTAA TGAAACTAAA TCAAGAATGC AAAAATCAAT CGAAAGCTTA 2820 

TCACGTGAAT TAGCTAACAT CAGTGCAlGGA AGAGCTAATT CAAATTTATT AAACGGCGTA 2880 

ACAGTTGATT ACTATGGTGC ACCAACACCT GTACAACAAT TAGCAAGCAT CAATGTTCCA 2940 

GAAGCACGTT TACTTGTTAT TTCTCCATAC GACAAAACTT CTGTAGCTGA CATCGAAAAA 3000 

25 GCGATAATAG CAGCTAACTT AGGTGTTAAC CCAACAAGTG ATGGTGAAGT GATACGTATT 3060 

GCTGTACCTG CCTTAACAGA AGAACGTAGA AAAGAGCGCG TTAAAGATGT TAAGAAAATT 3120 

GGTGAAGAAG CTAAAGTATC TGTTCGAAAT ATTCGTCGTG ATATGAATGA TCAGTTGAAA 3180 

AAAGATGAAA AAAATGGCGA CATTACTGAA GATGAGTTGA GAAGTGGCAC TGAAGATGTT 3240 

CAGAAAGCAA CAGACAATTC AATAAAAGAA ATTGATCAAA TGATTGCTGA TAAAGAAAAA 3300 

GATATTATGT CAGTATAAAA CTAATATACA ATGACATATT AAAATGCCAG TATTAAACGA 3360 

TAATGTAACA TTTAAAATGG GCATGTTTAA TTAAATCAAA GATGCATGTG ATAATTTAAA 3420 

TTCAC^^TGA GCATAAAAAT GGTGTTTAAA CAAGTTAATT AAACATATAC TTTATAAATA 3430 

ATAGGCATTA GGTATATTGC TATAATAAAG TTATGTAATT TTTAACCTCA GTATGTATGT 3540 

CACATTTCTG GTGTAAACTG TACCGAGTCA GACTTTGGTA CAGTTTTTTT ATTTGCTTAT 3600 

TCAATGCATT AAATGAGTAT GATAAAATGA TAATGATTGT TTAGTAACTT ATACTATATG 3660 

ACAGAGATGA TCAGGCTCGG AGGAAAGACC ATGTTTAAAA AGCTAATAAA TAAAAAGAAC 3720 

ACTATAAATA ATTATAATGA AGAATTAGAC TCGTCTAATA TACCTGAACA TATCGCTATT 3780 

ATTATGGATG GTAATGGGCG ATGGGCTAAG AAGCGAAAAA TGCCTAGAAT TAAAGGTCAT 3340 

50 TACGAAGtAT GCAAACAATA AAAAAAATTA CTAGGGTAGC TAGTGATATT GGTGTTAAGT 3 900 

ACTTAACTTT ATACGCCTTT TCCACTGAAA ATTGGTCAAG ACCTGAAAGT GAAGTAAA 3958 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 5333 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) T0P0LCX3Y: linear 



(xi) SEQUENCE DESCRIPTION: 

10 

ATTAAAACAA CTTAATATAC CTATTTATGG 
TAAACTTGAA GAACATCATT TATTACGTAC 
TGTGATTAAA TCTAAGCACT TTACGATTTC 

75 

AACTTATGGC GTCATCGTAG ATACACCTGA 
ATTTGATTTT ACACCTGTAG GCAAACCAGC 

2^ AGAAGGCGTT CTATGTTTAC TTTCAGACTC 
AAGCGAACGT GAAGTTGGTC AAAACGTAGA 
TATATTXGCT ACCTTCGCTT CTAATATTTA 

25 CAAAAATAAC CGTAAAATTG TTACGTTCGG 
TATGGAACTT GGTTATATTA AAGCACCACC 
TACCGTACCG AAGCATGAGT TATTGATACT 
AGCATTATCT AGAATTGCTA ATGGTACTCA 
CGTTGTATTT AGTTCATCAC CTATCCCAGG 
TTCCTTGTAT AAAGCTGGTG CAGATGTTAT 

35 

AGGGCATGGT TCTCAAGGTG ATCAACAATT 
CTTASCTATT CATGGTGAAT ACCGTATGTT 
CGGCGTTGAA GAAGATAATG TCTTCATCTT 

40 

CGATTCAGCA CGTAAAGCTG GTCGCATTCC 
TATCGGTGAT ATCGGTAATG TTGTAATAAG 

45 AGTTATCGTT GTTGTTAGTA TTGaTTTTAA 
TATTTCTCGA GGATTTGTAT ATATGAGGGA 
CAAAATCAAA ACTGATGTTA TTAGTAAGTT 

SO GATTAAATCT TCTATCATTG AAACATTACA 
ACCAATGATT TTACCAGTCA TTATGAAGGT 

55 



lEQ ID NO: 170: 

TGGTCCTTTA GCATTAGGTT TAATCCGTAA 60 

TGCTAAACTA AATGAAATCA ATGAGGACAG 120 

TTTCTACTTA ACTACACATA GTATTCCTGA 180 

AGGAAAAGTA GTTCATACCG GTGACTTTAA 240 

AAACATTGCT AAAATGGCTC AATTAGGCGA 300 

AACAAATTCA CTTGTGCCTG ATTTTACTTT 360 

TAAGATCTTC CGTAATTGTA AAGGTCGTAT 420 

CCGAGTTCAA CAAGCAGTTG AAGCTGCTAT 480 

TCGTTCGATG GAAAACAATA TTAAAATAGG 54 0 

TGAAACATTT ATTGAACCTA ATAAAATTAA 600 

ATGTACTGGT TCACAAGGTG AACCAATGGC 660 

TAAGCAAATT AAAATTATAC CTGAAGATAC 720 

TAATACAAAA AGTATTAACA GAACTATTAA 780 

CCATAGCAAG ATTTCTAACA TCCATACTTC 840 

AATGCTTCGA TTAATCAAGC CGAAATATTT 900 

AAAAGCACAT GGTGAGACTG GTGTTGAATG 960 

TGATATTGGA GATGTCTTAG CTTTAACACA 1020 

ATCTGGTAAT GTACTTGTTG ATGGTAGTGG 1080 

AGACCGTAAG CTATTATCTG AAGAAGGTTT 1140 

TACAAATAAA TTACTTTCTG GTCCAGACAT 1200 

ATCAGGTCAA TTAATTTATG ATGCACAACG 1260 

AAATCAAAAT AAAGATATTC AATGGCATCA 13 20 

ACCTTATTTA TTTGAAAAAA CAGCTAGAAA 13 80 

AAACGAACAA AAAGAATCAA ACAATAAATA 1440 
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GCTTTTTCTT TATATATGAT GAGCTTGAGA CATAAATCAA TGTTCAATGC TCTACAAAGT X560 

TATATTGGCA GTAGTTGACT GAACGAAAAT GCGCTTGTAA CAAGCTTTTT TCAATTCTAG. 1620 

TCAGGGGCCC CAACATAGAG AATTTCGAAA AGAAATTCTA CAGGCAATGC GAGTTGGGGT 1680 

GTGGGCCCCA ACAAAGAGAA ATTGGATTCC CAATTTCTAC AGACAATGTA AGTTGGGGTG 1740 

GGACGACGAA ATAAATTTTG AGAAAATATC ATTTCTGTCC CACTCCCGAT TATCTCGTCG 1800 

CAATATTTTT TTCAAAGCGA TTTAAATCAT TATCATGTCC AATCATGATT AAAATATCAC 1860 

CTATTTCTAA ATTAATATTT GGATTTGGTG AAATGATGAA CTCTTTGCCT CGTTTAATTG 1920 

CAATAATGTT AATTCCATAT TGTGCTCTTA TATCTAAATC AATGATAGAC TGCCCCGCCA 1980 

TCTTTTCAGT TGCTTTCAAT TCTACAATAG AATGCTCGTC TGCCAACTCA AGATAATCAA 2040 

GTACACTTGC ACTCGCAACA TTATGCGCAA TACGTCTACC CATATCACGC TCAGGGTGCA 2100 

CAACCGTATC TGCTCCAATT TTATTTAAAA TCTTTGCATG ATAATCATTT TGTGCTTTAG 2160 

CAGTTACTTT TTTTACACCT AACTCTTTTA AAATTAAAGT CGTCAACGTA CTTGATTGAA 2220 

TATTTTCACC AATTGCCACA ATGACATGAT CAAAGTTACG GATACCTAAA CTTTTCATAA 2280 

25 CTGCTTCATC TGTAGTGTCT GCAACAACCG CATGAGTAGC GATATCACTA TATTCATTCA 2340 

CTCTATTTTC ATCATGGTCG ATGGCCATTA CATCCATGTC TAATGCATTC AACTCACGAA 24 00 

CGATACTACC TCCAAAACGA CCTAGACCGA TGACTACATA TTCTTTACCC ATACTCGCCC 2460 

30 TCCATTAAAT GATTTTCATC AATTCATTGA AAATATAAAT TTAAAATTAT TATAAATGAG 2520 

TACCCCAACT AAATTATCTA AATGCAGTAA TGCAAGTAAA TGAAAGTTGG GGTATCGTCT 2580 

CAACTTATGA TTTCTTTCCT TCAACATATT CTTTGTCGAA AACAAATAAT CTTAATAATA 2640 

ATATTAACGA TGGAAGTAAT AAAAGTAAAC CTAAAATAAA GACAATCACT AATGTCCAGC 2700 

CCA'KTCTGG ATTAACATAT GCATCTGTAA TTTTTACAAA CGGATATAAA AGGTATGGCA 2760 

ATTTACTAAT TCCATAGCCA AAGAACGCGA ACATCATTTG TAAAATAACA AATACAAAAG 2820 

CCAAACCATG TTTTTTCTTA AAGAATGTTA ACAATGAAGC TAATGCAAAG AATAAGAAAC 2880 

TTATACCAAA CATCCACCAA TAGTCAAAAA CAGCTGAATA AAAATGTTCA GAATTTTGAA 2940 

TGCGTAATGA TAGAAATACG AATAAACAAA TGATAATCAT CGGCGGCCCT AAAAATATGT 3000 

GCCATTGTCT TGTTAAATTA TATGCTGGTT CGTCATTTGC TTTTTTAGCA TAATATGTCA 3060 

AAAATCCTGA TGAAATATAT AAAACTGAAA TAATTGCCAA GAATACTACA GACCAAGCAA 3120 

50 ATGGGCTTAA TAATAACTGC ACCCAATCTA GATCGATAAC ATTGTTTCGA ACATTAATAT 3180 

AGCCACCTTC TGTAATAGTT AAAGCAGTAG ATAATGAAGC TGGAATTAAT AATCCACTTA 3240 
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AACTGTTTCT CAACGATATC ATAATCAGTG CTATTGAACC TGGTATTAAC AATACCGTGC 3360 

CTAAATATTT GATTGACTCT GGAAAGAAAC CTACGAATCC TACGAAGAAG AAAACAAAGA 3420 

5 ATACATTCGT AACTTCCCAA ACTGGGTTTA AATAACGTGA AATTAAGTGA TTAATTTTCT 3480 

TTTCATCACC AGTTAACTTT GAATGCAATG CGAAGAAACC TGCCCCAAAA TCTATAGAAG 3540 

CAATAATGAT ATAGCAAAAT AAAAACAACC ATAACACTGT TATACCTATA AATGCATAAA 3600 

10 TCATTTTTCT ATTTCTCCTC CTTGCTTCTT GGCTAAACGA TTTACATCTT CATACGCCGG 3660 

TTTATTTTTA AACATACGAA TTAATACGTA TGCACATGTA TACATTAAAA TGATGTACAA 3720 

TATGCCAAAT AAAATTGTAA CGAaGGTTAT TCCGCCTGCT TGTGTTGCTG CTTCTGCCAC 3730 

15 

GCGCATATAA CCACGAACAA TCCAAGGCTG TCTACCCATC TCTGTTAAGA ACCATCCAAA 3840 

TTCTATAGCT AGCATTGAAG CTGGGCCTGT TAATAATATT CCATAAAGCA TCCATTTATG 3900 

AGTAGAAAAC TTTCTAAGCT TTTTAAACAT TAAAGTTAAG ACATAAACAC CTGAAATGAC 3960 

20 

AAAACATAAA ATTCCCATCG TTACCA7TAA ATCAAAGAAA TAATGGACGA TCATAGGCGG 4020 

ATGTAAACTT TTTGGAAAAT CATTTAACCC TTGTACTTTA GTTTTGACAC TATTATCTGC 4080 

2s TAAGAAACTC AATAGTCCAG GTAATTCAAT CGCACCTTTA ACTTGCTGAG TCTTTTCATC 4140 

TAACACACCA AATAATAATA ATTTGGCATG GGAAGATGTA TCGAAATGCC ATTCATAAGC 4200 

TGCTAATTTT TCAGGTTGGA ATTTATGCAA AAATTTTGCA GATAAATCCC CTGCCAACAT 4260 

30 AGAAAGTAAT GTTGAAAAGA ATCCAACTAT CATAGACATT TTCAAAGCTT TCTTATGGTA 4320 

GACAGTATCT TTAGGTTGAC GATTACGCAA TAATTTAAAA GCTGCTATTG ATGCAATAAC 4380 

AAATGCCATC GTCATACCGG CTGTAGTAAT TACGTGAAAT GATCGAACTA TAAACGATGG 4440 

35 

GTTAAACATC GCTTCTATAG GTTGAACATT GACCATCTTT CCATTCTTCA ACTCAAAACC 4500 

TGCAGGCGTA TTCATAAATG AATTCACTGA AGTAATGAAG AATGCTGAGA AAGAGCCACC 4560 

AATAATTACT GGTATACTAA TTAAGAAATG TGTCCATTTA TTTTTAAAAC GATCCCAAGT 4 620 

40 

ATATAAATAT ATACTTAAGA AAATAGCTTC AAAGAAGAAC GCAAATGTTT CCATAAATAA 4 680 

TGGAAGTGCA ATAACGTGTC CACCCATTTC CATAAATGTA GGCCAAATCA ATGATAATTG 4740 

AAGTCCTATA ATTGTACCTG TAACAACTCC CACTGCTACA GTAATTGTAT AAGCTTTAGC 4 800 

45 

CCATCTTTTG GCCATAGCTA TATATTGAAG ATCATTTTTG CGAATACCTA AAAATTCTGC 4 860 

AATTGCGAAC ATTAAAGGCA TACCAACACC AATCGTTGCA AAAATGATAT GAACTGCTAA 4920 

SO AGTCATAGCT GTCAAAAACC GACTGATTTC AACTGTATCC ATTTAAAAAC ATCACCTTTT 4 980 

TCTTTTTTTG ATGACAACAC AATGAACTTA ATTATAATTG CTATAATGTG TATTTTTAAA 5040 
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GAATTTCAAT GTATAATTGT GTATATTACA TTAGAATAAA GCACGAAGGA GCATGATACA 5160 

TGTCAGAAAT AATCGTTTAT ACGCAGAATG ATTGTCCACC TTGTACATTT GTAAAAAATT 5220 

5 ATCTAAATGA GCATCACATT GATTTTGAAG AGAGAAATAT CAACAATCAA CAATATCGAA 5280 

ACGAAATGAT AGATTTTGAT GCTTTTTCAA CTCCGTTTAT TTTGTTGAAT GGC 5333 



(2) INFORMATION FOR SEQ ID NO: 171: 

Ci) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 11126 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

15 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 171: 
ATACGTGACC CTTTATCCGA AAATTTCTTT TCATATTCTG TTAAAATATT ACTGCCATCG 60 

20 

TCTTCTTGAT GTAAATTTAG ATTTATTTTT GTAAAATACA TTCCAAATTG AGACATACTT 120 
TCTAAACTGT AGGCAAATAG TCCTCTGTTA TCAGTTTTAA AATGTAAATC TCCTTCATCA 180 

25 TTTAAGATTT GTTGATACAA CGCTAAAAAC GTATGATACG TTAAACGTCG TTTTGCATGA 240 
CGATTTTTTG GCCATGGATC TGAAAAGTTC AAATAAATAC GCGAAACTTC GCCGTCTTTA " 300 
AAATATTCAT TTAATTCAAT GGCGTCATTA CAAATAATCT TTAAATTTGT TAAACCCATC 360 

30 TCTTTAACTT TATCCAATAC TTTATAAACG ATACTTTTCT CACGTTCCAT TGAAATATAG 420 
TTAATATGAG GATTTTGAGC AGCTAATGTT GTAATAAACT GCCCCATACC CGAACCAATT 480 
TCAATGTGTA TCGGTTGCGT TTTaTCAAAC CATTCAGTCA TTTTCCCTGc ATGTTGACCG 540 
TCCATGTCAA CCAATTCAGG ATGATCTTTT AAATAATCTT CAGCCCATGG TTTGTATCGA 600 
ACTCTCATAT TTTATTCTCC TCTTAAATAA ACATGTTACT ATTCATAACT TCATTTAGGA 660 
ATTTAAGCCA AGTGTTCATA TCCTTATATC TTTTTTGCTC TTCATACCAT TGAACAAGAC 720 

40 

CTATAGATTG AATTACCGTA TACCATTTCA TACGTTTATT TAAATTCAAG CTCTCT.TGAA 730 
CACCATATGT TTCAAGCCAT TCAGACCATT GTTGTTGTGG AACATAGTTG TAAAGCAGCA 840 
TTCCGATATC AATTGCCGGG TCTGCAATCA TTGCACCTTC CCAATCAACT AAAAATAGTT 900 

45 

CATCTCGATC GGATAATAAC CAATTATTAT GATTCACATC ACCATGTACA ACAGTGAAAA 960 
AACGCGAATC TAAACTCGGT ATATGCTCTT CTAAATAGGT TAATGATTTT CTCACAATAT 1020 
SO GATGTGTTAA AACTTCTCTT GATAAAGAGG CATTAATTTT ATTAAGCATA ATCTCAGGAG 1080 
TAATAGGTTC CATTTCCATA CGCTTTAACA TACTTAATAA AGGTCTAGAA TTGTGTATCT 1140 
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TTTTCCAATG TTGTGCTGTA ACAACCTCGC CTGTTTCTAT GCGTTTCGTC CATACTAATT 
TGGGCACAAT ACCTTCTGCT GATAATGCCG CAATAAATGG ATTTGAATTT CGTTTTAAAA 
ACAACTTTTG TCCATCTTGT TCAGCCATAT ATGCTTCACC AGATGCACCA CCTGCTGAAT 
CAAGTGTCCA CCCTAATTGA TAAAACTGCT CCAACTCGTC CACCTCACTT TCAATTAGAA 
AATGGCTCTA GAAATAGGTT TTTCAAGAGC CATATATTCT AATTTATAAC ACCATACTGG 
TACAAATATT ATGTCCAGAT AATTATTGTA AATCCTCAAC CAATGCCTAC ATTACACGAC 
TAAATTTAAA TCGTAATGTC TGTCATTGAC ACCATACATT CTATAGTCAC TTACTTGACA 
TATAATGTTA CCGTGTCTAA AACTACATGT TTTTGAATCT CTGTAGGCGA TAAACTcTAG 
TTTTCAAAAT AATTGCTATC CCATTTTCAT GGTTAGCArA AATTTATGAA CTGTAACA*tT 
TACGTACTTA GTAAAATATG ATGCACATCA TATTTGTrAC TCATAGAAAA TTTTATAAtT 
TTTATCATTA TATTTCAACT GAAAATGAGA AACAAAATGG CACTTTTTAC TAATATGTGT 
TTTCTAAACA ACACTTTTAA GCTTCGTTTT AAATTATAAC ATAATTCACT TACGAAAGTT 
GATAAATTTA AGTAATTTAA TCTAAAAATA TGATGAAAGA ATTTTAAATA CTGTGTGACT 
CTATATACTT TTCAAATCCT TCTTGTAGTT GACGTGTAAT TGGGCCAACT TTACCATCAT 
TAACTGGTTC ACCATCTAAT TTAATAACAG GTGTAACCTC AGCTGAAGTA CTTGAAACAA 
TAACTTCATC TGCGTTTTTC AAGAAATCTA CAGTAAACGT TTCTTCTTTA AATGGGATGT 
TATAGTCTTC GGCAATTTTT TTAATTACAA TTCGTGTAAT ACCATTAAGA ATATAGTTGT 
TAATCGGATG TGTATAAATC ACACCGTCTT TAATTGCATA AGCATTACTT GAAGATCCTT 
CAGTTACAGT TtCACCTCGA TGTTGAATTG CTTCAACTGC ATTATATTTC ACAGCATATT 
CTTTTGCTAA TACATTcTCC TAATAAGTTC AAGCTTTTAA TGTCGCAACG TAACCATCGG 
ATATCTTCAA CGGTAACACC ATTCACACCA TTTTCTAAAT GATCATAAGG ACGATCATAA 



1260 
1320 
1380 
1440 
1500 
1560 
1620 
1660 
1740 
1800 
1860 
1920 
1930 
2040 
2100 
2160 
2220 
2280 
2340 
2400 
2460 



rrCTTTGTAT AAGCAACAAT TGCTGGTTCT ACTTCAGGTG TCGGGAAGCT ATGATTCCTT 
:CAGCTACAC CACGCGTTGC TyGAATATAA ATTGCCCCAG TTTCAATTTG ATTCATATCA 
tCTAATTTAC GAGATAGTTC AATTAATTCT TCTACAGAAT AATTTAAATC TAAACCAATC 
rCATTGGCAC TACGTwAAAw TCTTTCATAA TGTTCTGTTA CTGTAAATAA CTTACCATTA 
'ATACTCGAA TGTATTCATA AATACCATCG CCAAATACGT ATCCTCTGTC GTTGTATGAA 
lCCTTTGCTT CACTTGGACT TACAAACTCA CCATTTAAAA AAATTTTTTC CATATATTAT 
^CCTCCACGC ATAATGAATA AATTGCTTCT AAGTAAATAC TAGTTGCGTT AAATAACTGT 
TTTTAGTGA TATATTCATT TTTCTGATGC ATTAAATCTT CAGAATCACT AAACATTGCG 



2520 
2530 
2640 

2700 
2760 
2820 
2880 
2940 
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TCAGTCATAT CATTTGTTTG ATTTCTATAT GCAGTAACTA ACTTTTGTAC AAAAGGATCA 3060 

TTTTTATCAA CATAATGTGG TGGTTGGACT TTACCTAATT TCACTTCAAA GCCATATTGT 3120 

TGAATCTCAT TTGCAAAACG ATCCATAGCT TTTTCAAATT CAAATCCTTC TGGGTAGCGT 3180 

AAGTTGATAC CGAAAAGACC TGCGTTTTCA TTATCATATG TAATAACACC AATGTTAGTT 3240 

GTCACGTCAC CCATGACATC TGTATGGAAT TTCATTCCCA TCTTTTCACC AAAATCTGAA 3300 

TTAAATAAGT AGCGATTACT AAATGCTACA AACGCTTGTG CATTATTATC AAGATTTAAT 3360 

GATGCTAAGA ATTTTAGTAA GTAAAGACCC GCATTCACAC CGATAGATGG ATCCATACCA 3420 

TGAACCGCTT TACCTTCAAC TGTTAAAACT AGAATGCCAC TATCAACAGT ACTATCACCT 3480 

TGTAAATGAT TTTGTTCTAA AAAGTACTCA AAGTCTTGAA TAACATCTGT CATATTTTCT 3540 

TTAACAAGCA CTCTTGCTTC TGCATGATCA GGTACCATGT TGTAACGTTC ACCAGATTTA 3600 

AAAGTTATTA ATTCATAATC AGGTTCATCT TGATCTTCAG TAAGTTTATT TTGAACTAAA 3660 

TCAAATGTTG TAATGCCTTT TTCACCATGA ATACATGGAA ATTCTGCATC TGGTGCAAAA 3720 

CCTAATGTTG GCATTTCTTC TGTTTTAAAA TAGCGATCCG TACATTTCCA ATCAGATTCT 3780 

25 TCATCCGTAC CAATAATCAT ATGAATACGT TTCTTCCAAT CCACATTCAT ATCTTCTAAT 3840 

ATCTTAATTG CATAATAAGC AGCAATTGTT GGACCTTTGT CATCAAGTGT ACCTCTAGCT 3900 

ATGATAGCAT CTTCTGTTAC AACCGGCTCG AACGGATTAC TATCCCATCC ATCACCAGCA 3960 

GGAACAACGT CAACATGACA TAAGATACCT AATACGTCAT TTCCTTTACC TGCCTCAATT 4 020 

CTTCCTGCAA TATGATCCAC ATCATGTGTT GTAAATCCAT CTCTATGTGC AATTTCATAC 4080 

ATGTAGTCTA ATGCCTTACG AGGACCTGGA CCAACTGGTG CGTCTTCTGA TGCTTTTGCA 414 0 

TCATCTCrCA CACTTTCAAT TGCTAATAAT CCTTTTAAGT CATTAATGAT TTGATCTTCG 4200 

TATTGTTGAA CTTTTTCTTT CCACATTCGA AATCGACTTC CTTTTTTCTrA TAAGTTAAAT 4 260 
» 

TCTATTTTAC ATGAAAAGAT ATAAAAACTA CAATAAGATG TCAGAAAATA ATAAAAAGGA 4320 

ACAAAACGAT GCTATTGATA TGACACAAAT CATAAATAGC TGCTTTGTTC CTTTTTTAAT 4380 

TTATATATTT AAAATACACA TATTCAAGAG CTCGAGATAT AAGTCAATGT ACTAGGCACA 4440 

CAATTTAATA TTGACAGTAA TTAACCGAAC GAAAATGCGC CCCGGGGCCC CAACATAGAG 4500 

AATTTCGAAA AGAAATTCTA CAGACAATGC AAGTTGGCGG GGCCCCAACA TAGAAGCTGG 4560 

CCAATAGTTA GCTTTCAATA ATGTGCAAGT TGGGGTAAGG GCCCCAACAC AGAAGCTGGC 4620 

50 CAATAGTCAG CTTTCAATAA TGTGCAAGTT GGGGTAAGGG CCCCAACACA GAGAATTTCG 4630 

PiAl^GAPATT: CTACAGACAA TGCAAGTTGG CGGGGCCCCA ACACAGAAGC TGGCCAATAG 474 0 
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TAAAGAAATA CGTTTTCTTT AGATATTAGT ATTTCTTATG AATGAGTTTC ACGCATGTAT 4860 

TCTTCTTTCr ATATGCATAT TAGCTATGAC TAACGATAAA GAACCTGAAA CACTAATAAA 4920 

TGTCCTATAG TTTACAATAT TATATTGGCA GTAGTTGACT GAATGAAAAT ACGCTTGTAA 4 980 

CAAGCTTTTT TCAATTCTAG TCAACCTTGC CGGGGTGGGA CGACGAAATA AATTTTGCTA 5040 

AAATATGATT TCTGTCCCAC TCCCTTATCA TTTCTGTCCT ACTCACATCT TATTCTTTAT 5100 

CAGATAATGC ATTTTTATTC TTTTTTAAAT CTTCTTCAGT GACGATACGT AAATTATTAT 5160 

TTGGTGTGCG CCACCTTCAT CATCAAATTT ACCTTTTTCA ATACTTTCGT CAGTCTTATT 5220 

GTCATATTCG GTAAAXnTG ATTTTTCTTC TTTGAAAAAT GCTTTTGGAT TATTTTTTAA 5280 

TCTATTAGCA TATTCTTTCG GATTTGTTTT TACTTCTTTA ATTGTTTCAT TAGCAATTGT 5340 

TCCTAATTGC GTCGCTTTAT CCTTAGCATT ATCTTTATAG CTTTGAGGAT CTTGTTTATA 5400 

TTTATTATAT TCcTGcTTTC AGCTTGTCAC GACTATCTTT ACGTGTAACA AGTACAGCTG 5460 

CTACAGCGCC ACCTATACCT AAAATCGCTT TAAATAAATT ACCTTTTGCC ATATCAATCG 5520 

TCTCCCTTTT ATTTATAATT TAATTTGTCA AAATCATTTT CAGTTAATAA ACGATATTCT 5580 

25 CCTGAATCTA AATTGCTGTC CAATTCTAAA TCAGCAATTT TGATACGTCT TAAATGTAAT 5640 

ACCTCATTTT GAATGCTATG AAACATTCGT TTAACTTGAT GATATTTTCC TTCATAAATT 5700 

GTTACGTGTG ACGTTTGATT ATCAATATAA GTTAATATTG CAGGCTTAAC CTTGCCATCA 5760 

GTCAGTGTtA CACCCTCTTT AAAAGCTTGA ATGTCGTCTT CAGTGATAGG ATTTGCTGAA 5320 

ATAACTTCAT ATTTTTTAGA AACATGTTTG TTTGGACTCA TTAATTCATG ATTAAAATCA 5B80 

CCATCATTCG TTATCAATAA AAGCCCTTCT GTATCTTTAT CAAGACGACC AACCGGAAAA 5940 

ATATTTAGAT GTTGGTATTC AGGTATTAAA TCAATAACGG TTTTTGAATG ATGATCTTCA 6000 

GTTGCTGATA TATAACCTTT TGGCTTATTT AACATAATAT AGACATTTTC AATGTATTCT 6060 

ATTAATTCTC CACGAACTGT TATCTTATCG TTTTCTGGTT CTATATGTGT TTTTGGTGAT 6120 

TTAATTACTT GTTCGTTGAC ATTTACAAGG CCTTTTTTAA GTAACTGTTT GACCTCATTA 6180 

CGTGTACCGA CGCCCATATT TGCTAAAAAT TTATCTATTC TCATCGTAAA AACCTAACTC 624 0 

TACGTCTTAA TTITTCAGGA ATTTCACCTA AGAATTCGTC CGCAAGACGC GTTTTAATTG 63 00 

TGATTGTACC GTAAATTAGA ATACCTACTG TAACACCTAA AATAATAATG ATTAAGTAAC 6360 

CAAGTTTAGT AGGTTCTAAG AATAGATTTG CAAGGAAAAA TACTAATTCT ACACCTAGCA 6420 

SO TCATAATAAA TGAATACAAG AATATTTTTG CAAAATGAAT CCAACTATAG CTGAATTTAA 64 80 

ACTTCGCATA TTTTTTAAGA ATATAGAAAT TACATCCAAT TGCAAATAAT AATGCGATAC 6540 



33 



40 



45 



55 



836 



10 



IS 



20 



EP 0 786 519 A2 

ACTTGATAAC TACAGAAGCT AAAATAACAT AAACTGTTAA TTTCTGTTTA TCTATACCTT 6660 

GTAACATTGA TGCCGTTACA CTTAATAGTG AAATTAGTAT TGCTACAGGC GCATAATAGA 6720 

ATAATAAGCG ACTACCATCA TGGTTAGGGT CATGACCTAA AACAATTGGA TCGTAACCAT 6780 

AGAAAACTGT GAATAATGGT TGTGCCAAGG CCATAATTCC AATACTAGCT GGAACAGTTA 6840 

TAAACATTAA TACACCAATA GATGTTCTAA TTTGATGATG CATTTCATGT AAGCGACCTT 6900 

CTGCAAATGT TTTTGTAATA TAAGGAATTA AACTCACTGC AAAACCAGCA CTTAATGATG 6960 

TCGGAATCAT TACAATTTTA TTAGTTGACA TATTTAGCAT ATTAAAGAAT ATATCTTGTA 7020 

ACTGTGAAGG TATACCAACT AAAGATAAAG CACCGTTATG TGTAAATTGA TCTACTAAGT 7080 

TAAATAATGG ATAATTCAAA CTTACAATAA CGAACGGTAT ACTATAAGCA ATAATTTCTT 7140 

TATACATCTT GCCATATGAC ACATCTATAT CTGTGTAATC AGATTCGACC ATACGATCAA 7200 

TATTATGCTT ACGCTTTCTC CAGTAATACC AGAGTGTGaA TATACCAATA ATCGCACCAA 7260 

CTGCTGCTGC AAAAGTAGCA ATACCATTGG CTAATAAAAT AGAGCCATCA AAGACATTTA 7320 

GTACTAAATA ACTTCCGATT AATATGAAAA TCACGCGTGC AATTTGCTCA GTTACTTCTG 73 30 

25 ACACTGCTGT TGGCCCCATA GATTTATAAC CTTGGAATAT CCCTCTCCAT GTCGCTAATA 7440 

CAGGAATAAA GATAACAACC ATACTAATGA TTCTTATAAT CCAAGTAATA TCATCGACTG 7500 

ACCAACCGTT TTTATCATGA ATGTTTCTAG CTAATGTTAA TTCAGAAATA TAAGGTGCTA 7560 

AGAAATACAG TACCAAGAAA CCTAAAACAC CGGTAATACT CATTACAATA AAACTCGATT 7620 

TATAAAATTT CTGACTTACT TTATATGCCC CAATAGCATT ATATTTCGCA ACATATTTCG 7680 

AAGCTGCTAA TGGTACACCT GCTGTCGCAA CTGCAATTGC AATATTATAT GGTGCATAAG 7740 

CGTATGTGAA CGGCGCCATA TTTTCTTGTC CACCAATTAA ATAGTTGAAT GGAATGATaA 7800 

AAAgJaCGCC CAATACCTTG GTAATTAATA TACTAATGGT AATTAAAAAG GTTCCACGCA 7860 

CCATTTCTTT ACTTTCACTC ATTACGAATC TCCCTATCTC ATGTTTATTA AAGTTTTGTA 7920 

AACTAAAAGC TGTTTCTCTG TAAAATCATT TTTCATTATT ATGAATATAT CACAAAACTT 7980 

TATTTCATTG TCGTATATTC AATGAATTAT CATAACAAAA TTATCAACAC ATTGTCATTG 8040 

AATACTAGAT TTTGATTAGA ATATTACGAA ATTTCATATA AACATTATAC TACTATTTGA 8100 

GATGAACATC GCATAACAGT AGAAAAATCA TTCTTATCAT ACACATACAT CTTCATTTTT 8160 

TATa^U^GTTC ACATTATAAA TATATTCAAC ATAATTGTCA TCTCATAACA CAAGAGATAT 8220 

SO AGCAAAGTTT AAAAAAGTAC TATAAAATAG CAATTGAATG TCCAGTAACA AATTTGGAGG 8280 

AAGCGTATAT GTATCAAACA ATTATTATCG GAGGCXSGACC TAGCGGCTTA ATGGCGGCAG 8340 
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GTAAACTCAA AATATCTGGT GGCGGTAGAT GTAACGTAAC TAATCGATTA CCATATGCTG 8460 

AAATTATTAA GAACATTCCT GGaAATGGGA AATTTTTATA TAGTCCCTTT TCAATTTTTG 8520 

ATAATGAATC CATCATAGAT TTTTTTGAGT CTAGGGGTGT TAAATTAAAA GAAGAAGATC 8580 

ACGGGCGTAT GTTTCCAGTT TCCAACAAAG CACAAGACGT GGTTGATACA TTAGTGACAA 8640 

CTATCGAACG CCAACATGTA ACGATTAAAG AAGAAGAAGC TGTTAGTAGA ATCGAAGTTA 8700 

ATACAGACCA AACTTTCACT GTACATACTC AAAATAATAG TTATGAAAGC CATTCGCTAG 8760 

TGATTGCTAC AGGTGGTACA AGTGTCCCTC AAACTGGTTC AACTGGTGAT GGTTATAAGT 8820 

TCGCACAAGA TTTAGGTCAT ACCATTACTG AGTTATTCCC GACCGAAGTT CCAATTACAT 8880 

CAGCTGAACC TTTCATCAAA TCCAATCGTC TAAAAGGTTT AAGTTTAAAA GATGTTGAAT 8940 

TGTCAGTACT TAAGAAAAAT GGTAAAAAAC GCATCAGTCA TCAAATGGAT ATGTTATTTA 9000 

CTCATTTTGG TATCAGTGGT CCAGCTGCAT TAAGATGTAG TCAGTTTGTT TATAAAGAAC 9060 

AAAAAAATCA AAAGACACAG CACATTTCTA TGGCAATCGA TGCATTTCCT GAATTAAACC 9120 

ATGAACAATT AAAACAACAC ATCACATCAT TATTATCGGA CACACCAGAT AAAATCATTA 9180 

AAAACAGTTT GCATGGTCTA ATTGAAGAGC GCTACTTACT GTTCATGCTG GAACAAGCAG 9240 

GAATCGATGA AAATACCACA TCACATCACT TATCAAATCA ACAATTGAAC GACTTAGTAA 9300 

ATATGTTTAA AGGGTTTGTA TTTAAGGTGA ACGGGACATT ACCTATAGAT AAGGCATTTG 9360 

TCACAGGTGG TGGTGTGTCA CTTAAAGAAA TTCAACCTAA AACAATGATG TCTAAATTAG 9420 

TTCCGGGATT ATTTTTATGT GGTGAAGTAT TAGATATACA TGGTTATACT GGTGGTTATA 94 80 

ATATTACAAG TGCACTCGTA ACAGGACATG TCGCTGGATT ATATGCCGGA CATTACTCAC 9540 

ATGCATCAAT GGAATAATAG TATAAAATTT GGTTCGATTC TCTTTAGTAG ATCAACTTTT 9600 

TCATXCAAAT AAAAATGACC TTAATATAAC TGAGTCACTA AAAAGTGTCG TTATATTAAG 9660 

GTCATTTCGT TAATTATGAT TCTTTTTCGT TTTTAGTACG TCTTCTAGCT AACAAAGCCG 9720 

CACCTGTAAT CAGTGCAAAT TCTTTCAATG GTAAATCCAT TCCTTCAGAA CCTGTATTTG 9780 

GAAGTTCTTT TTCAACTTTG CGCGATTCAT GTGTCTCTTC TTTTTTAATA GGCGTACAAA 9840 

CTTTTGGAGC TGGCTGAATT TCTTTTGGTG ATACTTTCGT CGCTTCAGCT GGTAATTTAA 9900 

TTGCTAAAAT TTCATCAACA ATGAATTGCG TGTGTTGTTT GATGTCATTT AATGTCGCAT 9960 

CTTCATCAAT CATTCTATTG CCATCTGCAA CATATTGATC AATTAATACT TTTACTTTAG 10020 

CTAATTGTTC TGGTGTTGCG ATCGCTTTGA ATTTCGCATA rGTTTGTTGA GCAATGTTAT 10080 

CAATTCGCAG TAAGCTATTT TCTTTTTCAG TAATTACTGC TTCTATATCG CTTAATGCAA 10140 
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CATCCATTTG TAATTTTAAA GCAGTTATAG CTTTTAATGC ATCAGCCTTA TTACGATTAC 
TTACTTTTCG ATAATTTTGC ACTAAAGCAG TGACGCGTGC AAGATCATCA TTAATCGTTT 
TTTCAGCATC TGGCTTTTTA ATAGGATGTA CATCTAAATC ATGTATTGTT TGTAGATTTA 
ATGATGCTGT TTTATCAACT TGTGCATTGC TACGATCTTG ATCAATTTGT CCAATAGCAG 
TGTCATAAAT ATTTTGTAAC TGTGCTAATA TACTATTTCT TTCTTCTACC GTTGCTTGAA 
TATTCGCTTC AATTGCTTGT TTTTTATCGT TGAATAATGT TGTCAATTGT TCTCGAGCAG 
ACGCCTTTCT GTTAATAACA GGTTCGATTT CACGAATTTC GTTTTTCTCA TCATGCAATA 
AATATGCCAC ATCTGCATTA GTCACTGCAC TAGCAATTTG TTGTTTAGCT TTAATTAACT 
CTTTTTCAAC TTGTGCTATT GCAATATTTT GTTCTTCATC TGTCGCTTCG TTATTTGCTT 
TAATTAAATT AATTTTATTT GTAGCGATAT TTTGAATTTG TTGTAAXGCT GTTGCTTTAA 
CTGTTGTCGC TGGTTTAATT TTTGAAATAA TATTTTGAGC ATTTATACTA TCTTGATTAA 
CTTGGGCAGT CTTATCTGCA TGATTGATCT GATCAATAGC CTGATTAAGT GCTTGTTCTA 
CTAAATGTTT AGCAGCTAGT CTTTCTTCTT CAGTTGATAA ATCGCTTTGA TCGATTAGTG 
CATT.TTGAGC TTCGGCTTTT ACACCAACAG ATTGACGCGC TGCTGGTTTA ACTTGAACTT 
TAGGTAAAAT CACTTTGATG TTGTCGTTGC CATCAGTCnC AGTnCGATCC ACTTCTGCAT 
TCGTTTTGTT TTGTGCAATG TCATTT 
(2) INFORMATION FOR SEQ ID NO: 172: 
(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3660 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : do\lble 

(D) TOPOLOGY: linear 



10260 
10320 
10330 
10440 
lOSOO 
10560 
10620 
10680 
10740 
10800 
10860 
10920 
10930 
11040 
11100 
11126 
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ixi) SEQUENCE DESCRIPTION: SEQ ID NO: 172: 
TTGCCCCGCA CGGCGGTGTG nXTCCTAGAA ATAATGAATA TAAAGaGAAA TATATAACAA 
CGATTTTGAA TTATGAACCT GGTGATATCG TTACAATCAA ACGTGTGAGA GATAAGACCG 
ATTTGCTAAT ATATTTGTCT AGTAAAGATA TTTCTATTGG TAATGAAGTG GAAATTGTAT 
CX*AAAGATGA AATGAATAAA GTAATTATCA TTAAACGTAA TGATAATGTA ATTATTGTCA 
GTTACGAAAA TGCAATGAAC ATGTTTGCTG AAAAATAAAA TAAAGAAGCC ATAAAGATAT 
CCATGATTGA ACTGATAAAG ACATATGGAT AATTGCTTTA GGCTTCTTTT TTATTAGTTA 
ATTTATCAAG TGAGTATATT TGAGTAAAAT ATTCACTGCA TAAAGATTGA AGATAATCCA 
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CTGTGGACTC 


GGACGCTGGA AAGTCAATTT 


AGCAATCGTC 


CAACTAGATT 


GTAGAACTTC 


540 




GCCTAATAAT 


ACACCTAAAA 


TATATTGATA 


ACTCATTGTG 


ACAAGTAGTT 


GAATTTCTAC 


600 


5 


TATATTTTCA TCTTTTAATA 


TAAAATACAA 


CATGATAGAA 


ATTAAAGTTA 


TAACAACAAT 


660 




GGGTGAGCCT 


TTTCtAGATG 


TTAAAATTAA 


AAAATAAATA 


AATATCAATA 


AATAGGTAAA 


720 




TATAAAGAAA 


CTAGGTATCT 


GATAATGGCT 


CGACGCTAAA 


CCTATCAATA 


ACATAATAGG 


780 


TO 


TGGCATAAAA 


TAACCACCAA 


TCGTTGTAAG 


CCATTGGCCT 


GCTAGATGTC 


TAGATTGTGT 


840 




AATTGCGAAT 


CCTTGTTGTA 


ATGTCTGTTG 


TCGCTCTCGT 


GGACTTGTTA 


CAATGACTAA 


900 


15 


ATCTTTTGCA 


CGGCCACCAG 


CGAGTTTATT 


AAACAGTACA 


TGACCAAATT 


CATGTGTTAA 


960 


AACAGGGATA 


TAGTTTAAAA 


TGACATCTAA 


ATAGTTCAAA ACAGGCTTAT 


GTCTATATTG 


1020 




ATGAATAGCA ATATAACAAG 


CTGCAACAAT 


AACGATAATG 


TATATATTAA 


GTTGAATTGT 


1080 


20 


GGTATTAAAA AAGTTTGATA AATAATTCAT TGTTAACCTC 


ATATAAGATA 


TTAATiTAAA 


1140 




GTTTGCTTAT 


CACTTATTAT 


AAATGATATT 


GGCATCAATA 


GCGTTAGACT 


TTAGACTTAC 


1200 




■ CTTAGTTAAA 


CTAATTTTAA 


TTTTTGAAAA 


GGTGAATATG 


TGTTAAAATA AAGCAAAATC 


1260 


25 


ATTTCGATAT 


AAATAGGATG 


AATATAAATA 


CTGTTAATAT 


TGATTACACT 


AACATAATAA 


1320 




TGAAATAAGA 


TAGGAGATTC 


CTGTTATGAC 


TGTIXSAAGAA 


AGATCCAATA 


CAGCCAAAGT 


13B0 




TGACAlTiTA 


GGGGTCGATT 


TTGATAATAC 


AACAATGTTG 


CAAATGGTTG 


AAAATATTAA 


1440 


00 . 


AACCTTTTTT 


GCAAATCAAT 


CAACGAATAA 


TCTTTTTATA 


GTAACAGCCA 


ACCCTGAAAT 


1500 




AGTGAATTAC 


GCGACGACAC 


ATCAAGCGTA 


TTTAGAGTTA 


ATAAATCAAG 


CGAGCTATAT 


1560 




TGTTGCTGAT 


GGGACAGGAG 


TAGTCAAAGC 


TTCGCATCGT 


TTAAAGCAAC 


CTCTAGCGCA 


1620 


35 


TCGTATACCT 


GGTATTGAGT 


TGATGGATGA 


ATGTTTGAAA 


ATTGCTCATG 


TAAATCATGA 


1680 




AAAMTATTT TTGCTAGGGG CAACTAATGA AGTTGTAGAA 


GCGGCACAAT 


ATGCATTGCA 


1740 


40 


ACAAAGATAT 


CCAAACATAT 


CGTTTGCACA 


TCATCACGGT 


TATATTGATT 


TAGAAGATGA 


1800 


GACAGTAGTG 


AAcGnAnTTA AACTGTTTAA 


ACCTGATTAC 


ATATTTGTAG 


GTATGGGATT 


1860 




CCCTAAACAA 


GAAGAATGGA 


TTATGACACA 


TGAAAACCAA 


TTTGAATCTA 


CAGTGATGAT 


1920 


45 


GGGCGTAGGT 


GGTTCTCTTG AAGTATTTGC 


TGGGGCTAAA AAGAGAGCGC 


CTTATATCTT 


1980 




TAGAAAATTA AACATTGAAT GGATATATAG 


AGCATTAATA 


GATTGGAAAC 


GTATTGGTAG 


2040 




ATTAAAGAGT 


ATTCCAATAT 


TTATGTATAA 


AATAGCCAAA 


GCaAAAAGAA AAATAAAAAA 


2100 


SO 


GGCGAAATAA TCATGATGAC AAAAATAAAA 


CCGAGGAAAT 


CCTTAAATGG AGATTCTCGG 


2160 




TTTTTTCGGT 


TTATTTAATA 


ACGAAGCGGG 


ACTCATCGAG 


TTTGTTTCTA AATTCTTTTT 


2220 
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CATCAAGTTC ACCGTAATCT TTTAACTTTC CGCCTTCAAT CCAAGCAATC TTAGTACAAA 2340 

ATTGTCTCAC TTGTCCTAAG TTATGACTAA CGAAAAAGAT GGTTTTGTTT TGCTCTTTAA 24 00 

ACTCGTAAAT TTTATCTAAA CATTTTTGTG CAAAAGTTTG GTCACCTACA GATAAAGCTT 24 60 

CGTCAATGAC TAAGATATCT GGATTAACTG TGATATTAAT TGAAAAACCA AGTTTTGCAC 2520 

GCATACCACT TGAATACTTT TTAACTGGTT GATAAATAAA CTCACCAAGT TCACTAAATT 2580 

CAATAATCTT AGGTGTCATC GCTTTAATTT CTTTTCGCTT AAAGCCCATA CATAACATTT 2640 

TAAATTCGAT ATTTTCAATC CCTGTAAGTT GTCCACTCAA GCCAGCACTA ATTGCGATAA 2700 

CGCTGACTTC ACCATTACGA TCCACTTTGC CAACAGTAGG CGACAAAGAA CCXSCCAATGA 2760 

TATTGCTCAA CGTTGATTTG CCGGAACCAT TGATGCCAAC AAGCCCTATG ACGTCACCTT 2820 

CATATGCTTT TAAACTAATG TCATCTAAAG CXJAAAAATGT TTTGTTTTTA TGTTTGGGAA 2880 

TGAGCGCATC TTTCATACGT TCTTTATTTG TACGATAAAT ACGATATTCT TTTGTTACAT 2940 

TTTTAATGTT TACCGAAACG TTCATTTGTA GACCTTCCTT ATTCACATTT ATCTAGATTA 3000 

TAATATACTA CTCAACAGTT GTTAAATTTT AAAACCTGTT GTAAAGTGTA TAGAAGATTT 3060 

25 TGTTATTATC AGAGTGGGTG TTTTGACACA AAATGTTAAT CATCAATGAT AACAATGATA 3120 

TTTAAAAACT AAACTTATTT CAACTTACAT GATTGTATAC TATAATGTAT TTGTAATAAA 3180 

CTAATATTTT AAAGAACTAG ACAATAATTT TGATAGCATC CATGTATAGT GATAGTATTT 3240 

ACAACAATTA TTATAATACT ATTTAGTTAA GTAGAGAAAT AGTTAAACAT TTGAAAGTGT 3300 

GGTTTAATGG AATGTCAGCA ATAGGAACAG TTTTTAAAGA ACATGTAAAG AACTTTTATT 3360 

TAATTCAAAG ACTGGCTCAG TTTCAAGTTA AAATTATCAA TCATAGTAAC TATTTAGGTG 3420 

TGGCTTGGGA ATTAATTAAC CCTGTTATGC AAATTATGGT TTACTGGATG GTTTTTGGAT 34 80 

TAGGAATAAG AAGTAATGCA CCAATTCATG GTGTACCTTT TGTTTATTGG TTATTGGTTG 3540 

GTATCAGTAT GTGGTTCTTC ATCAACCAAG GTATTTTAGA AGGTACTAAA GCAATTACAC 3600 

AAAAGTTTAA TCAAGTATCG AAAATGAAcT TCCCGTTATC GATAtACCGA CATATATTGT 3660 
(2) INFORMATION FOR SEQ ID NO: 173: 

■ 

45 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 13868 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

so 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 173: 
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ATTAATCACT TGTTGTGTAG AGTCTTGTCC GTTTTGGTTA TGATTGTrAG CCATGATATA 120 

CCTCCCTTAC AACACTCGTG GACCAGAAGT TTTCTGATCT CTCACATTAA CTTCTAACTT 180 

ACGTACTGGC ATTTCTGTGA AATATTCTAC ATTCTTTTTA ATATCCGAAC GAATTGCTTC 240 

AGTTAAAGAT TGAACTTGAA GAITATTTGG TACGAAAAAG TCAGTTTTAA TGTCGATATA 300 

AGATTTATTT TTTTTGTTAT ATAGTTTCGC AACTACATTT GGTTGTCTTA CTTGATCATA 360 

TTXTGCAACC GTATCGAATG CCGTCTTTTC AACAGCTTTA CGAGATACGT AAACATGACC 420 

ATCATCGAAG TCTTTGTATA ATCCAGGTTT TCGATGCGTA GGTTTGAAGA TACTAAATAC 480 

TAATATAAGA CCTATTAATA TCAATAGTGC AGCAAGTGAA ATAAGTAATG GTTGGAACCA 540 

TTCAAATTGA AGGAAGTAGT CTTGATATTC AGTTATACGT CCATCTTGGA TATACATGAA 600 

TAACAGGAAC CCCACGaTTA CTACTATTAA TAAGCCAAGG ATAAAGTTTT TAAGTCGTTT 660 

CACCCCTAAC GACACCTCCT TAGTTAAAGT TAATTTAAAA ACATATTAAA TATGTACCCA 720 

TCAGTTTTTr TCTTAAACAT AATAAATTAA TAACTTTAAA TTTATTTTTA ATATATAAGA 780 

TGAAGTACCA TTTAGTAATA TATTCCCTAG TTTTTGTAAA TAAAACCTCA TTATTAATTA 840 

25 ATTyTCGTCA ATATGTTTTG AAGAACGATA TTCTAAAATA TCTGGGTCAC GATGTTTAAT 900 

TAAAACCTTA TTACTATTTC TCGGTTTCTC CTCACTCAAA GATTTTATAA GCGACCATAT 960 

CATCGCTATA ATGACCACGG AAAATGGTAA CGCAGCAATG ATTAATAAAT TTTGAATTGC 1020 

TTGAGTACCA CCTGTGTAAA TCATGATGAT TGCAAATAAT GCCATAATGA TACCCCAACT 1080 

CACTTTGACA AATGACTTCG GATTAATATC ACCACTTGAA CTCAACATAC CTAAAACATA 1140 

AGTTGCCGAA TCCGCTGATG TAACAAAGAA AATCATAATA ACAAGTAAAG TAATTAAGCT 1200 

TAATACAAAA CCTAGCGGAT AATGTTGTAG CGTCGCAAAA GTTGCTGTTT CTGTCGCAGC 1260 

TTTAGCAATA TCGGCAATAT GATTATCTTG TAAGTAAATT GCTGACGCGC CGAATACCGC 1320 

AAAGAATATA AAGCAAACTA ACGCCGGGAC AAAAAGTACA CCTAGAATAA ATTCTTTAAT 1380 

CGTACGTCCT TTTGACACAC GTGCAATAAA TATACCTACA AATGGTGCCC AAGATATCCA 144 0 

CCATGCCCAG TAAAAGATTG TCCAATTTTG TAACCATTGG AATTTTTGAC CACCTGTCGG 1500 

AATGCGTAAA CTCATACTAA AGAAATTTGC AATATAATTA CCTAGACCAT TCGTAAATGT 1560 

ATTTAAAATG TATAGCGTTG GCCCAACAAT AAAAAGACCA ATAAGTACTA CAAAAGCAAG 1620 

TAACATGTTG ATATTACTCA ACGTTTTGAT ACCTTTATCG ATACCTGACC ATGCTGACCA 1680 

50 AGTAAATAAT ATGGTTGCAA TGACAATCAA GATTACTTGC ATCGTGAAGT TACTCGGTAC 1740 

ATTAAATAAA AAATGTAAAC CTTCGTTTAT TTGCAATGCA CCGAAACCTA ATGTTGCAGC 1800 
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CATTGCCTTT TCACCTAATA AAGGCGTCAA TGTAGCGCTG ACTAAGCCAG GATATCCTTT 1920 

ATGAAAGCTA AAATATGCAA ACACTAGCGC GACAATACCA TAGACTGCCC ATGCATGAAT 1980 

CCCCCAATGG AAAAATGAAA ACTGCATTGC ATCATTAATT GCAGATTGCG TGCCAGCTTT 2040 

ATGAATAGGC GTTAATTTGA AGGCATGACT GATTGGTTCT GCCGTTGTCC AGAACACAAG 2100 

TCCTATTCCC ATACCAGCAC TAAATAACAT AGCAAACCAA GACGGCAATG AGAATTCAGG 2160 

ATCTTCGCCT TCTTCACCTA ATGTAATGTT TGCGTATCTC GAAAATAAAA TATACACACA 2220 

GACAAATAAA ATAACTAAAA CGAGCAATAA ATAATACCAA GAAAAATGTA GCGCAATAAA 2280 

TGTAGTAATG TTTTGCGTGA GTTTTTCTAA CTGTTTCGGA AATATTGCTC CAAAAGCAAC 23 40 

AAATATCGTA CATATCACTA AAGATACCCA AAACACTAGA CTTACTGATT TATTTTTCAT 2400 

AAATACAAAC CCTTTCTGTG TAATGGTAAG TTCATACCCA TAACTGCAAC ATTTTAATCA 2460 

TTTGTAATTT TATATAGACA CAATTAATAA TGCCTCATCT TTTAAAAATG ATATATAAAA 2520 

CACACTCAAA TTATTTATCA TTGAGCAACA AAGTATTTTA TTGTATTTAA GTAATGCCTT 2380 

TCTAGTGCAT TATTGATTTG ATACCTGCAA AGTTGCCATA TTTCCGTTTA GAATCAATAG 2640 

25 TCGCTAGACA CAAAAAATAA GTCGCCTATA CAGTATTTTC TGCATAAGGC GACTTTACTT 2700 

ACTAATCTAT ATATTAATTA CTAATTTTCC AATCATTGAT TGrTTTTCCA ACAATTGATG 2760 

TGCTTGATAT AAGTTTTCAG GTGATAAACC TTCAAAAACT TGTGTCGTTG TTGGTTGGTA 2820 

ATGCCCTGAT TCTATATTTT TCGTAATATC TTCTAAATAC TCATGTTGTT TAATCATATC 2880 

AGGCGTTCGA TGAATTGGAC GCGCAAACAT AAATTCATGT GTAAATGTTA TACTTTTTAA 2940 

TTTTAATGCA TTTAAATCTT GATCTTCATT AAAAGCTACG ATAGTCGTAA TATGCCCTAA 3000 

TGGTTTTATC AGTTCAATCA TAGTATTGTA ATACAAGTCT GTATTATAGG TGCAAAATAT 3060 

ATAAICTACT AATGGAATTT CTTTAAATTG ACGCACTAAA TCCTCTTTAT GATTCAATAC 3120 

GATATCTGCG CCCATCTTTT CACACCACTC TGTTGTTTCT TGTCGTGATG CTGTTGTAAT 3180 

GACAGTTAAA CCATACCGTT TAGCAATTTG AGTGGCTATA CTGCCTACAC CACCGGCACC 3240 

ATTAATGATT AAGACAGACT TCCCTTCGTT TTCAGCAGGA TTCGTAGAAA TTTTAAATGT 3300 

ATCAAAAAAC GTTTCATATG CCGTAATACC AGTTAGCGGT AGACTAACCG CTTCATTAGC 3360 

ACTTATGTTG TGTGGTGCTT TTGCAACTAT AGCTTCTGAC ACCAATTGAT ATGTCGCATT 3420 

TGATCCTTGT CTATTTGGCG ATCCAGCATA AAATACAACG TCACCCGGAC TAAATAATGT 3480 

SO AACGTCTGGT CCGATAGCTT CAACAGTACC AATAGCATCA AACCCAAGTA CACGAGGTGC 354 0 

TTGAGTGACT TCCATTTGTC GTTGCTTTGT ATCTACAGGA TTTACACTAA TGCTATTTAC 3600 
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ATTTCCTTCT TCCAATTTAA AGGGCTTCTC AAATCCTATC ATTTTCATAT CGTTTCACCT 3720 

CATTTATGAA CTTATTTCTT ATTATACAAA ATAGAAGCCA TGTGTGCTTA TATCGCAGCA 3780 

TCATGACTCC TTTTTCATTT GAATATATAA ATAATTACAG ACGACTTTCG TATTAAATTT 3840 

TAGACTTATT TCTACCATGT TGCTGAACAA ATTTACTTTA GATAAAAAAT TATTAAATTT 3900 

TGGTCAATTA ACAAAGTTAG TTTGTTAAAA CGTgATACTT TATTATTCCG TTACTTTAAT 3960 

AACTTGTTTA CCAAAGTTAT CGCCAGTaAA TAAATTTTTA AATGCATGTG GCGCATTTTC 4020 

AAAACCATCT TCAATGGTTA CTTGTGACTG AATTTTACCT TCTTGAACCC ATGTTGCAAG 4080 

CTGTTCACTA GCTTCTTTAA AAGCATTAGC GAATTCACTT ACCAAGAAGC CTCTCATCAT 4140 

TACTTGCTTC TTAATAAGCG TACCTTGAAT ACGTGGTCCG ATATCGGCTT CAGGATGATT 4200 

ATATGACGAA ATTGCGCCAC ATACTGGTAC ACGTGCAAAA CGATTTAAAT GCTTAAATAC 42S0 

TTCATCGCCA ACTGTTCCAC CAACATTTTC AAAATAAACA TCAATACCAT CTGGTACTGC 4 320 

TTGTGCTAAC GCTTCTGCAA AATCCTCTTT CTTATAATCA ATACCAGCGT CAAAGCCCAG 4380 

TGTCTCTGTT AAATAATTTA CTTTTTTGTC GCCACCCGCA ATACCTACTA CACGGCAACC 4440 

25 TTTAATCTTA GCAATTTGAC CTACAACTGA ACCTACAGCA CCAGATGCAG CTGAAACCAC 4500 

AACAGTATCA CCGGCTTTAG GTTGTCCAAT ATCAAGCAGA CCATGATATG CTGTTTGTCC 4560 

TGGCATTCCT AAAACACTTA AATATAAATC AAGTGGTACA TCTGTCGTTG GAACTTTAGT 4620 

AATTTGATCC GCTTGGACAT GATTAATGAT TCGCCAAGGC AACATACCTA CAACGACATC 4680 

TCCTTTTTTA TAATCTGCGA GTGTCGAATC AATTACTTTT GCAACGACAT GGCTAACAAT 4740 

CGGTTTACCA ATTTCAAAAG GCTGTACATA CGAATCTGCC TTAGTCATAC GTCCTCTCAT 4 800 

ATATGGATCC ACTGAAATAT ACAGCGTTTG TACAAGTACA CCATCGCTCT CAAGTTTaGG 4 860 

CGTCiCAATC TCTTCaATTT TGAATGTATC CTCTTGAGGC ATGCCkTCTG GTATTTTGTT 4920 

AAAAAGAATT TGTTTATTTT GCATCATTAA TCACCTTTCT TTATTTGAAA CTTTTACTTA 4980 

TTTGTTACTT AAGCGTTAAG TTTGAATTGT GTCtTCGTGA TGTCTGTATG CAAATACATT 5040 

CTTAGTTGTT ATATTTTGAC TTAAGCACTG ATTCATTCAT GTAACTTCAA CCACATTATA 51 00 

4S TTTGCTATAA TCATAAATTT AAAATGTTAC GACTTAGACA TTTTATGGAA ACTCTCAAAC 5160 

AATAGATAAT TTTTGAAAAG CTCTAATATT ACAAGCTTTT TTGCCCCAGA AAAACTAGCA 5220 

GTTGCTTTAT TTTTTCCATA AGAAGTCGAT TAACTCATTA GCAACATTTT CATTCTCATG 5280 

AAGCTGACTA TGTTGTGCAG GCTCACCTTC ATATTTAGAT TCTCGATAAC TTTTCGGACT 5340 

ATTTCCCAGT AAATATTTTA ATGATTTCGA AGAACTATTA GACACTCTGC CGTCTGAATG 5400 
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ATCTTTTAGC ACGCGTAATT GCTGATAAGG TTGATTCATT CGACTTGGTT TACCATCTTT 5520 

ATCAACTGTA ATTTCATTGA CATCTTCATT CATATTTAAA ACACCATTAA ATGTCCCTGC 5580 

AATATTCACT TGTTTGTTTA ACTGTGGCAG TGACTTGTCG TTACCATATG TCATCATATA 5640 

TTGTGCAAAT GTTAAGTTCC CCATTGAGTG ACCGACAAAG TTGAATTTAT CGAAATTGTA 5700 

TTCAGATTGT AACTTAGTCA GTACATTTTT AAACCACGCA GCATTCTTAT CCAAATAGCC 5760 

TTGTCTGTTA TTTTCAAGTT CAATTTTCAC AATAGGATTC ACTGCATCTT TTCTTAGTTT 5820 

CCCTTTAAAT GTCACTGCAC CATCCTTTGA AACGTAAGCA GTGATGATAT CTTTAGTTAC 5880 

CCCTCTTTTT TCTGCTTGCT TCACCATAAA CTTTTCAGAA TTGGCACTAC CACCAAATCC 5940 

ATGTAAGAAC AATGTTGGAA TTGGCTTTTT AACAAATTGC TGTTGTTGTA TTTTAAATGT 6000 

TTGTGCCTGT CG1TGACTAA ACACCACCAT AATAATAGAG CCTATAATAA TAGCGACCGC 6060 

TAACAATG7C GTAATAATTA CAAAAATTTT CTTCACACTT TTAACTCCCA TTCATGTCTT 6120 

TTATATAAGT ATAAAGGATG TGATTAAAAA TGTCCTTTAG TTGATTTTGA ATACATCATT 6180 

AACTTTTAAG ATGACTTTGG AAAGTTGTCC GTTAACGTTT GTTAATTGAT TGCTTCTTTA 6240 

2s GCTTTCAATG GTGTGTCACC CATTGATTAA TATATAAATA TGTATATGCA TGTTTAATTT 6300 

ATCTCTTTCT ATAAATAAAG ACCTACCAGC ACTCGACTGA TAGGCCTTTT AATATCTATA 6360 

ATTATTTAAT TTCTTTTGTT TCGGCTAACT CTTTGTACCA ATAAGCACTT TTCTTAGGAT 6420 

30 AACGTTCTTG AGTCTCAAAA TCGACATAGA ATAAACCATA TCGTTTTTCA TAACCATTTG 6480 

ACCAAGAGAA CACATCCATT AATGACCAAA TAAAGTAACC TTTAACATTT GCACCATCTA 6540 

TAATAGCATC TGCAATAACG TTCAAATGTT GTCTTACATA ATCAATACGT GCATCATCAT 6600 

GAACTGTTTT TTCAGATTCA ATAAATTCAT CTTTATATCC TAAACCATTT TCAGTGATAT 6660 

AAAXPTTATG aTAGTTAGGA TAATCTTTAA CAACACGCAT GaTTTGATCA TATAAACCTT 6720 

GAGGATAGAT CATCCAGTCC CAGTCTGTGC GAGGTACGTC GACATCAAAT TCACGTTGTC 6780 

CGACACCTTT AAGTTGGTAT TTAGAACCGC CTTTATCACC TGTCGCATTA TGCGTGATTT 6840 

CAGATTCTCC ATCGTAACCT CTCATCCAAT CACTCATGTA GTAATTGATA CCTAAGAAGT 6900 

CGTTTAAATC TTTGGCTGCA TCTAAAATGG CATAATCTTC ATCTGTAATG TTTAATTTAC 6960 

CGCCATTAAC AGATAAGATA TGTTGCACAC CTTCCATCGT TTCACGAGAA TACTTACCTA 7020 

AATATGTTGC ATCTAAGATG AATTTATTAT GGATGATATC TTCTAATTCT GCTGCACGAA 7080 

SO CATCTTCAGG ATTTGATGGA TCGAACGGAT ATTTTGTTGG CAATGCGTGT ACAACACCAA 7140 

TTTCTCCTTT GTATCCGCCA TCTTTAAATA ATTTTACTGC TCTAGCATGA GCCACCATCA 7200 
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CTACTAAATA TTGACCATCA CCAATAGGTC CAATTTCATT GAATGTAGTC CAATATTTTA 
CTTCTGGGAA TTCTTTAAAA CAATATTCAG CATAATCTAC AAAGTAGTCA ATCGTTTTAC 
GATTTAGAAA ATCGCCATCT TTGTGTAaCA CTTCTGGTGT ATCAAAATGA TGCAATGTTA 
CAAATGGTTC AACATGACGT TTATGACACT CTGCAAATAA CTTATGGTAA TACTCAACAC 
CTTTAGGGTT AACTTCGCCA TATCCATTTG GGAAGATACG AGACCATGCA ATTGAAATTC 
GGATACCATT AACACCGAAT TTTTCACTTA ATTCTAAATC CACTGGATAT CTGTTATAAA 
AATCACTCGC TGGTTCTGCA GTGTACCAAT AGTTTTCTTC TAAATACGTA TCCCATGCTA 
CGCGACCTTT ACCATCCGTA TTTGTCGCAC CTTCTGCTTG ATATGCTGCT GTTGCTCCAC 
CAAAAATAAA ATCTTCAGGT AATGTTTTAG TCATATGAAA AACTCCTATT CTTAATTTTC 
AAATTGTTGT TGAACGAAAT CAAGGGCTGC TTGGCCATCT CGTGTCAATT TGATATATTC 
AGCACCTTGA GTCTTCGCTA ATTTAATACC TAATCTATCT GTATCTTGCT TAATATCTTC 
ATAGTTAGAC GCAACTTGTG GCGCTAAAAT GATrAATTGG TACTCTTTCA TAATGTCCAT 
ATGTGCGCCA TATCCGCCAG cTGCCGCTTT CACTGGCACA TGATATTCTT CAGCTGCTTT 
ATTAAGTGCA TTGGCTAATA ATCCACTTGT ACCACCACCG GCACAAAGTA CTAAGACATT 
TGTTTGTTCT GTGATATTTG AAGCTTTAGC TGCATCGTCT GATACACCAC TTGCCGCTAA 
AATTGAATCA GCTTTTTTCG TATCAAAGTT TGCTGCAACT TTTTCTTTTA AATCTGAATT 
ACTTTCTTTA CGTCCTTCTT CTTCATCAAG AATTTCACTA TCATAAACTT TTAGGAATGG 
GTAGTAAATA ATAATATCTA CAACAATCAA AGTAATAGCT AGTACGAATG ACCATAAACC 
AAAACCTGTA CCCATGATAA TGCCCAATGG ACCTGGTGTT GTCCAAGGTA AATTCACACT 
AAAACTATTC ATTCCTAACA CTTCAACGAA AAGTTTGAAA ATCCATACGT TAACAATTGG 
TGCI^TACA AATGGAATAA AGAACACAGG ATTCAATACT AGTGGTGCAC CAAATAAAAT 
TGGTTCGTTT ACACCAAAGA ATGTTGGTAC AACTGATGCA CGTCCAATCG CTTTGTTTCG 
TTTAGATTTC GTCATCCACA TAAACATGAA CGGGACGACC AATGTTGCAC CCGTACCTCC 
AAATGTAACG ATAAACATTT GTGTACCTGA TGTAATAATT TTATCTGCGT GTTCTCCAGC 
TTGAAGCAAC TTGAAGTTCG CTTCGATATT CGCATATGTA ATGGCTGCAA TTGCTGGCTC 
TACAATTGAC GGACCATGAA TACCTACAAA CCAGAATAAT GCAAAGGCAC CAAAGATAAT 
TGTGACACCA ATCCATCCAT CTGCTGCTGT AAATAATGGT TCGAATAATT TTAAAATACC 
TTCCGCTACA TTTGATTTAA AGCTGTTGCG AATGACTAAA TCTAATGCAT AAAGAATGAT 
GATTACCGCT GAAAATGGAA TTAAGTCCTT AAATACTTGT GAAATATTCG GCGGTACTTC 
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AAATGCTGAT AAGAATGCTG TTAATAAACC TTTAGTTCCC ATAAATGCAC TTAAGAATCC 9120 

ACCATCTTTG GCTGGATCAG AAGCTAAGAA CAAGAATCCA CACATCGCTG CTAGCATTGT 9180 

AGAAATAAAG TTAATTTGAT TTGTACTTTC TAGCTTACGG TTAAATGAAT CTGTTAAAGA 9240 

TTTCGCTGTC GTTCCTGCTA CTAAAAATGC TACAAGCCCC ATCGTATAGT TATATGGTTT 93 00 

CATTAAAATG GCTTCCATGC CTTTATCCCA TTTAAAACCA AATATATTTG GCACATATGC 93 SO 

AATTAATAGA AAGATACTTG AGAATAAGAT GACAGGCATT GCAGAAATAA ATCCATCACG 9420 

GATGGCTCTT AAATATATGT TACGTGATAA TTTCTCGAAA AATGGCTTCC CTTTTTCAAT 9480 

TTGTGCGATC AATTTTTGCA TCATTGTCAT CACCCTCTTT TATAAAATTC TAATAAATGC 9540 

TTCATTAAAT CTTTCAGTAA AATTGTTGTC ATTAAATGAT CTTGACCATG CATCATCGTT 9600 

ACACTGTATG CAATATCATC ACCTTGCXiCT TCTTTAGCCA ACAGGCTTGT TTGTGCTCTA 9660 

TGCGCTTCCG CAATGCAATT GTTTCCTTCT TCAATCAGTG CATCTGCTTT TGCAAAATCT 9720 

CCAGCTTGAG CTGCTGTTAA TGCTTCTAAA AACTTAGAAC GTGCATCCCC TGCAAATGCA 9780 

ACAATTTCAA AACCTAATAA TTGGACTTCT TCTCTATTCA TAGCATTAAT CCCCTTTTAA 9840 

ACTTATTTTC TTTGTTTCCA AGATGTCGCA GTATCTTTTA ATACTTTATT TAAGTCATCA 9900 

ATATTTTTGA AACCAGTTGT ACGTAACCAT TCACGAGCAG CATCTTCACC TTGTTCAATG 9960 

TATACTTGAA CAGCACCAGA CCATGTAGCA CGGCCACAAA GTACCCCGTT GAATTTAGCA 10020 

CCAGCTTCGT GAGCAAATTT TAAAGTTTCT TGGAATAATT CCGCAGAAAC ACCAGCACTT 10080 

AAGTAAATGT ATGGTAAATG AGTTGCTGCA TCTTGATCTT TAAAGTGTTG TGCCGCTTCC 10140 

TCTTTTGTAT AAACCACTTC ACCTTCAGCA AAGCCTTCTA CATATTTCAT GTTTACTGGT 10200 

ACTTCAACTT TCAATACATC AACGTTAAAG CGTGGTTCTG AGAATAATTT CATTGCTTCG 10260 

TTAACCTTTC TAGGCTTAAC TTTTGCGAAT TcAACAcTAC CGTTATcAGG AATGTTGTCA 10320 

TCGTATGTTA ATACTTCTAA AAAGAATGGA ATATCTTCTG CAACACATTC TGAACCGATT 10380 

CTTTCAATGT ATGCTTTCTT TTGAATGTTA ATTTCTTCAG CATCATCAAC ATCATAGTAA 10440 

AGTAAGAATT TAACAGCATT TGCGCCTTGT TCTTTTAAAC GTTTTGCAGA CCACTCTACT 10500 

AAACAGTCAG GTAAACGACC TTTAGCGTTT ACGTCATATC CAGTTTTTTC ATAAGCAAGT 10560 

AATAATCCAC AATCTTTGTT ACGTGCATCT GAAGCTGGTA AACCATATTC AGGATCTAAT 10620 

AAAATTGAAG ATGCATATTG TGTTAATTCT TCCGCAACTA ATACTTTTAA TTGTTCAATT 10680 

TGAGCTACAG TTGGTTCTTC AGTTTGATGT TTTGCCATCA TGCGTTTTAA AGCACCACGT . 10740 

TGGTCAAATG CTAATGCAGA AATGATACCT TCGTTGTTAC TTAATTGTTC AATTGATGCG 10800 
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TCATCATAAT TATTTAAATT GACATAACCT GTTTGTGCTT CTTGTGCATT CAGCATGCCT 10920 

AAAGTATTGG CTTTTTTTAG TAAATCGTGG TCGTTTTCAT GATTAAGAAT TGCTGAAGTA 10980 

ATTCCAGCAA CTGTAGAATC ACCTGAACCA ACCGGATTTA ATACACTTAT TGTCGGAATA 11040 

TTCACTCTAT AGAATGTATG ATTGTGCTTA GCGAATGCAC CTTGTGCACC TAAAGACACA 11100 

ATAATCCACT CAATCCCTTC GAATAAGGGT TGTGACACTG CCTGTTTCAA ACTTTCTAAA 11160 

CTTTCATCAA GTGGCTGGTT AAGCAATTGA TATAGTTCAG AAATGTTTGG TTTAATGACT 11220 

GTAGGTTTG7 ATGGATTTTC CAAAACTGTT TGCAAAGTtG CACCCGAGCA ATCTAATATC 11280 

ACAGGCACAC CTTTGTTTTG GCATCGTTCA ATGATTTGTG CATAATAATC TTGATTTAAT 11340 

CCTTTAGGTA AGCTACCTGA AATAGCAACT GCTTCAACTT TTTCTAATAA TTGTTCAAAA 11400 

TGTTTAATAA ATCCTGCAGC CTCTTGATTA TCAATCTCCG GTCCCTGCTC TAAAATTTCT 11460 

GTTTGTTGCC CTTCATGTAA AATTGCAATG CAGTTTCGTG TTTCACCCTT AATGTTATAA 11520 

AATGCATGCT TGATGTCGGC ATGATCTAAT TTTTTAGCAA TAAATTGACC TAATTCACCG 11580 

CCAATAAAAC CACTCGCAAG GACTGGCTCA CCTACTTGCG CAAGTACTCT TGTTACATTT 11640 

AAACCTTTAC CACCAGCTGT TTTACTTACT TCTTGAACAC GATTAACATC ATCTAATTTC 11700 

AATGCTGTTA ATGGGTATGA AATATCAACG GATGGATTTA ATGTTAAAGT TAAAATCATA X1760 

TGTGTCGTCC CTTAATCGTG GTATTCGCCT CTGTCCCATT TTTCTAAGAA TTCATCAAAG 11820 

AAATGTGGAT CAGCTTGATC TGCATTGCTT GTTTCTAAAT GTTTAATTTT AGCGATTAAT 11880 

TTTTTGTTCT CTTCAGTTGG TTTATATTCA GCATTAATAA ATGCATCGAT AATATCGCAC 11940 

ATTAATAACT CACCTATAAT ACGTCCACCG AAGCCAATAA CGTTCGCAr? TAATTCTTCT 12000 

TTAGCGTATA ACGCTGATGT CATATCACGT ACTAGTGCTG AACGAACGCC AGGTACTTTA 12060 

TTTACAGCAT TGTTAATACC AACACCTGTT CCACAAATAC AAACACCTAA GTCTGCATTA 12120 

CCGCTAACAA CTTGTTCGCC AACTTTTTTA CCAAAAATTG GATAATGTGT TCTTGTGAAA 12180 

TCGTATGTTC CTACGTCAAT GACTTCATGT CCTTTTGATT TTAAAAATTC AGATACACGC 12240 

ATTTTTGTAT CTGTAACAAT ATGGTCGCAT CCTAATGCAA TCTTCATAGT AATTTTTCCT 12300 

CCTTAGCACA TTTTATTAAG CATATCTACG CGGATTTGGT GTCTACCACC ATCGTATTTA 12360 

CCTTCAACAA AACCTTTAAC GACATTTTTC GCTAATGTGT CTCCAACAAT TTCAGATCCC 12420 

ATAGTGATCA TTCTTGAATT GTTATGGCCT CTAGTCATAT ATCCAGAGCG TTCATCTGAT 12480 

AC1TCAGCAG CAATCATGCC TTTGATTTTT GTAGCAACCA TAAAGCTACC TGCACCAAAT 12540 

GCATCGATAA CAATACCTAA GTTACCTTCT TGACTTTGAA CATCTTTTGC TACAGCCAAA 12600 
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TCTAATAAGT ATGATTTGAT GACTTCTTTT AATCGTTTGC CAGCTTCATC TGAACCAATA 12720 

ATAATCGCCA TAATAAGACT CCTTTTTACT TTAATTTTGA AATACCTTTC TTAAAATGTG 12780 

ACATATTTAT TTGTAGGTTA TGAAAATCTT GAGAAAAGGC TTTCAATTTG ATTACGTTTA 12840 

AATTATAAAC ATAAACAAAC AATAAATCAA CATAATATGT TTATAATATG TTTGTTTATG 12900 

ACGTAmrC AAACAATAAG TGAACATTCA TATTGTGGTG TTGTTTTAAT TAGGTATTCG 129 SO 

TCTGAAATTG TAGTAAAACT TTGTCGAGGT TCCCGTTGaC ATAAATTTGC ATAAAAAAtA 13020 

GCCCATAAAT GAATGCAAAT TCACATTCAC TTATGAGCAT ATAGATACAT ATTTTAACAA 13080 

TGCAGTTATA CTTTTAATTr AGTCGACTAC TTCAATATAT GTTTTAATCG TTXCTACTTT 13140 

TTCTTCATCT TCATAGTCCA TGACCACTGC AGTCAATTCG TTTAACTGAC AAAATGATGT 13200 

AAAATCTTCT TTGCCAACTT TCGTATGATC GATTAACAAG TATTTTTCAA TTGAATTACT 13260 
TAGTGCCAGT TGTTGCGTAT AGGCTTCATC TAATGTAGAT GTCATCACAG CACCTTTATT . 13320 

TACTGCGTTA CTACTAAAGA ACATCTTGCT AAATCTTAGT TTTTCCAACA TGGCGTTCGC 13380 

CATTTCACCT ACAAATGCTT CTGTAATATG GCGCATTTCA CCACCAATTA AATAGACACG 13440 

25 AAAATGTGCT GTTTGTTTTT CTAACAAAAT TTTATACACC GGCAAACAAT TCGTAATAAT 13500 

TGTGAGCGTA TGATGATTGA CTTCTTCTGC TAATAGTTCC ACTGTTGTTC CTGGTCCGAA 13560 

AAACAAAGTA TCCCCATCTT CAATTAATGA TGCAGCTTTT TTAGCTATAA ATCGTTTTTC 13620 

TGCAATTTGA CGGGTATGTT TTTCTTTATG CGATATTTCT TTATACTGAA ATGTTGAATT 13680 

ACTGCGTGCA CCACCATGAA TCTTCGTTAA AATCCCTTTA TTTTCCAATT CAATTAAATC 13740 

TCTTCGAACT GTCATATCAG ACACATTTAA ACCTTCGACG ATTTCATTCG TTCTTATCGT 13900 

GCCCTTTTTA TTCACTAGTT TAGCAATTTC GTCCAAACGT TCATGTTTAT TCAATGTAAA 13860 

ATTGCSrrC 13868 
(2) INFORMATION FOR SEQ ID NO; 174: 

40 

(l) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4 54 9 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
4S (D) TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 174: 
50 TTAAGTCAAC TTTGTCTATA CGGTTTGGAT CtTCTaCCCA ATGTCTTATA AAAGACAATC 60 
CCGCACCTGA AACATAACTC ATGAAATAAG AAAATGGTAT ACCATTAATT TGATCATTTT 120 
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AATCTTTACC 


CATACGAAAC 


ATCAATTGAT AAAATGCGAT GTCTTTTTCT ATCATTTCTA 


240 




TTAAAACCXJT 


CATAATTTGA 


TGTATGTTAT CCGTGGATAA CTTAACTGCT CCATTTAACT 


300 


5 


TCTCATCATG 


AATGAAGTCT 


CTTATTTCCT CCAACTGCTG GTCCTCTAAT TTTTCAAGCA 


360 




AATCATACTT 


ATCATAATAA 


TGCGTATAAA ATGTACTACG GTTAACATC^ GCTAAATCTG 


420 




CAATTTGTTG 


CACAGTAATC 


TCTTCTAATT GGTGTTGATG 


TAAAAGTTCA ATAAATGCAT 


460 


TTCTCATTGC 


AACTTGTGAT 


TTTCTAATAC GTCGATCTAT 


AGTCATTTAT ATCAAGTCCT 


540 




CCCCAATGAT 


TATAAACGTT 


ATCTTCATTA TCCCACAAAT 


CTCCAACATT GATGATTGGC 


600 


T5 


ACACAATGTT 


TACCTGTTTA 


ATATAGGTGA TACAAACAAA 


CAGAAAAAGG TGATAACAAT 


660 




GAACCAACAT 


TTACTAGGAA 


ATCCAAAATT AACTGTAACT 


CATGTCAATG AAGTTAAAGC 


720 




CGGTATTAAC 


CACATCGTTG 


TCGACAGTGT TCAATATGGA 


AATCAAGAAA TGATTATGGA 


780 


20 


AAAAGATGTC 


ACTGTGGAAA 


TGCGCGATGG CGAAAAATTA 


TATATTAATA TTTTCAGACC 


84 0 




AAATAAAGAT 


GGCAAATTCC 


CTGTAGTTAT GTCTGCAGAT 


ACTTACGGTA AAGATAATAA 


900 




GCCTAAAATC 


ACAAATATGG 


GTGCCCTTTG GCCAACATTA 


GGTACCATTC CGACATCTAG 


960 




TTTTACACCT 


GAAGAATCAC 


CAGACCCAGG ATTTTGGGTG 


CCAAATGATT ATGTTGTAGT 


1020 


• 


TAAAGTTGCA 


TTACGCGGTA GTGACAAATC CAAAGGCGTC 


TTATCTCCAT GGTCAAAAAG 


1080 




AGAAGCGGAA 


GATTATTACG 


ArTGATTGAA TGGGCAGCAA 


ATCAGTCATG GAGTAATGGA 


1140 


30 


AATATCGGGA 


CAAATGGTGT 


TTCTTATCTT GCGGTGACTC 


AATGGTGGGT CGCATCATTA 


1200 




AATCCACCAC 


ATTTAAAAgC 


AAtGATTCCT TGGGAAGGCT TAAATGATAT GTATAgAGAA 


1260 


35 


GTAGCCTTTC 


ACGGAGGTAT 


luCCAGATACT GGCTTTTATC 


GTTTC7GGAC TCAAGGTATT 


1320 


TTTGCGAGAT 


GGACAGATAA 


TCCAAATATC GAAGATTTGA 


TTCAAGCACA ACAAGAACAT 


13B0 




CCTCTGTTCG 

■ 


ATGATTTTTG 


GAAACAGCGT CAAGTGCCAT 


TATCACAAAT TAAAACACCT 


1440 


40 


CTACTAACAT 


GTGCTAGTTG 


GTCTACACAA GGTTTGCACA 


ACCGTGGCTC TTTTGAAGGA 


1500 




TTTAAACAAG 


CTGCATCTGA 


AGAAAAATGG CTATATGTGC 


ATGGACGTAA AGAGTGGGAA 


1560 




AGTTACTACG 


CTAGAGAAAA 


TCTCGAACGC CAAAAATCAT 


TCTTTGATTT TTACCTTAAA 


1620 


45 


GAAGAAAATA 


ACGATTGGAA 


AGATACGCCT CATGTCATTT 


ATGAAGTTAG AGATCAATTT 


1680 




TATAAAGGCG 


AATTCAAATC 


AGCGTCACGT GTCCCTTTAC 


CTAACGCAGA ATATACACCA 


1740 




TTGTATTTGA 


ATGCTGAAAA 


TCACACATTG AATCATGCAA 


AGATTAGTAG CGCGCATGTC 


1800 


SO 


GCACAATATG 


ACTCTGAAGA TAAACAACAA GATGTAAGTT 


TTAAATATAC GTTTGACAAA 


1360 




GATACTGAGT 


TAGTTGGAAA CATGAACTTA AAACTATGGG 


TAAGCACTAA AGACTCAGAT 


1920 
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CCTGATTTTA ATCATATTGA AAATGGTCAA GTAGCTACTG GTTGGTTACG CGTATCACAT 2040 

CGTGAATTAG ATCAAGAAAA ATCCTCAATC GCGCAACCTT GGCATAAACA TGAAACAGAA 2100 

TTAAAGTTGT CACAAGATGA GATTGTACCT GTTGAAATCG AATTGTTACC TTCAGGCACG 2160 

CTATTTAAAC AAGGCGAAAC ATTGGAAGTT GTTGTAAAGG GTAGTGAAAT TGTAATTGGT 2220 

AATAGTACTC CTGGCATGAA AACACGTTAT GAACATGAAG AAACCGTAAA TAAAGGCATG 2280 

CACATGATTT ATACTGGTGG TAAATATGAT TCACAATTAA TCATTCCTAT CGTTAATTGA 2340 

TATGCAGCAA TTACGGTCGC TTTTGATTAA AAGTGACATA GTGATAGGAC TGTATAACAA 2400 

GAGAAAGCCA CACGCTTGGA ATCTTAAACC AAGGTGTGGC CCTTTTTATT ATTGATGGCT 2460 

ATTTAATTTT ATAACACTAT CGTATTTTCT TTTTCATGAA TCATTTCAAT AATGACATTA 2520 

TCTTCATTCA TTACTGCTAC TTTAGGTGCA TGGTTTTTAA TTTCTTCTTC ATTCAACTGT 2580 

GCATAAGTCA TGATTATGAC TACATCGCCT ACTTCAACAA GTCTTGACGC TGCACCGTTT 2640 

AAACAAATTT TACCACTACC TCTTTCACCA GCTATTACGT ATGTTTCAAA ACGTGCACCA 2700 

TTATTATTAT TCACGATGGC TACTTTTTCA TTTGGCAAGA TGTCTACCGC TTCCAATATA 2760 

TCTGAATCAA TCGTAATGCT ACCTACATAA TTTAAATTTG ACTCAGTCAC TCTTGCTCTA 2820 

TGAATTTTAG CATTCATCAT TGTTCTTATC ACTTTATTCA GCTCCAATTA TTATATTATC 2880 

TATTAAACGC GCTTTTGAAA ATTTAACAGC TAAcGAGATA AATATGCGTC CAGTTATTTC 2940 

30 GTGTTGTTCT ACTAATTGAG GATAACTATA AACAGCAACT TCTTCAATGC GTTCACTTAT 3000 

ATGTGATTCA AGATATTCAG TAACCCTGTC TATAATTACT TTACTTTGAC GTTCACCGTC 3060 

TTGATACAAC GCTTGTGCTA ATAGCAAACT TTTACTTAAA TGTACCGCTT CTTGTCGTTC 3120 

TTGCTCCGTT AAATAAACAT TTCTTGAACT TTTCGCCAAA CCATCTGCTT CTCGAACGAT 3180 

ATCAJTACCA ATAATTTCAA CGGCATGATT GAAGTCTTTT ACCmTTTGCT CGaCAATAGC 324 0 

CAATTGCTGG GCATCTTTTT TACCAAAATA AGCATAATCC GGCATAACAA TATTAAATAG 3300 
CTTATTAACT ACTGTTACCA CCCCATCAAA ATGCCCTGGr CCGtTCGCTC CTTCTAACAC • 3360 

ATCAGCTAAT GGGCCTACTT TGACATCAAT ACCTAATTCA CCTGGATACA TATCTTCTAC 3420 

TGCAGGATGA AAAACAATGT CCGCTCCTAC TTCTGATACT AATTCTAAAT CTTTATCAAT 3480 

TTGTCTCGGA TAAGCATCGA AATCTTCGTT TGGACCAAAT TGTAATGGAT TAACAAATAC 354 0 

ACTCACAATT GTAATATCAT TTGTACTAAC TGATTCGCGT ACCATCGTTA AATGTCCATC 3600 

50 ATGTAAGGCA CCCATTGTTG GGATAAAACC AATCGTTGTG CCTGAGCGTT TGGCTGCTTT 3660 

AACAATGTGT TGCATCTCTT TTACCGTAGT AATCAGCTTA GTCATTGTTA TTAACCTCAT 3720 



25 



35 



40 



45 



55 



851 



EP 0 786 519 A2 



10 



15 



GATCGTATTG TTTTAAACCA TCCACACCAA CACTAAAATC AGCAAATTGC TTCACAAATT 3840 

TCGCTTTATG TTCAACACCA TAATTTAACA TATCGTGATA AACCAATACT TGACCATCTG 3900 

TACCTTTTCC TGCACCAATA CCAATGACTG GAATTGTTAA GTGCTTGCTA ATTTCTTCTG 3950 

CTAAATCATT TGGAATTGCT TCAAGTACTA ACGCAACTGC ACCAGCTTGT TCTACATTTT 4020 

TCGCGTCTAA AATAAGTTGc TCCGCTGCTT CTTTCGTTGC ACCTTGTAAT TTATACCCCA 4080 

TAACGCCAAC ACTTTGAGGT GTTAATCCTA AATGTGCAAC AACAGGAATA CCAATTGCCG 4140 

TTGCmTTC AATAAATGGT GTAATATGCG CTCCTTCTGC TTTAATTGCA TTTGCATTCG 4200 

TCTCCTGATA AAGCTTTAGA GCATGATTTA AGTCTTGTGT CATAGAGATG CCTACTGCAC 4260 

CAATCGGCAT ATCAACAACT ACAAATGTAT TTGGTGCGCC TCTTCTTACT GCACGACCGT 4320 

GATGAATCAT ATCTGCTAAC GTCACTTGTA CGGTACTTTC ATAACCTAAT ACAGTCATAC 43 BO 

CAAGTGAATC CCCAACAAGA ATCATATCAA TACCCGCTGC TTCCACTTGT TTAGCACTTG 4440 

GAAAATCATA AGCTGTTACC ATAGAAATTT TAGTTTGCTT TTGTTTCATA TCTATTAATT 4500 

GACTTACTGT TTTCAATGTT ATTCAACCTC TTTTTGCAGT ATnATTAGA 4549 
25 (2) INFORMATION FOR SEQ ID NO: 175: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 6339 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDSDNESS : double 
(D} TOPOLOGY: linear 
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(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 175: 

TTATCTTTTG TTGTTTCCTT AGACAAACGA CTAACCACAT TATAATGGAC TAATTTATTA 60 

ATTTTATTTA ATTCCATTAA GTTATCCGTA ACACTAAGTG AAGATGCGGA GTTCACTCTC 120 

GTTTGTACTC TTCGTTTTAA TAAAGCACCT CGTAATAATA CAATCATTCT TCTTATTAAT 180 

GATGCTTGTC TATATACCTG TGTTCTTTCA GCATAACGCA TATAGTTTTC AAGTACACTA 240 

TTCGTTATTT GTCCTTCATC TACTAAAGAC TCTAATGTTT TkGTTTCTAC ATTAAAAGCA 300 

4S ATTTTTTGTA GACGTTCTAA TTCTTTAGAG TTTTCATCAT CTTTCTCTAC AGTTTTTAAA 360 

AATGCTAATT TATCATGATA TTCTTTAATC ACGTTACCAT ATTTAAAACT TGTTTCGAAA 420 

GTAGATTTTT GATTTAGATA ATCAATAACT TGTTCTAATA TATAAATTCT AGCAACTTTA 4 80 

AACGAGATAT TGCCAATTAC TGTTTTAGGT GCAGGTTTCG TTAATAATGG CAATAATACT 540 

TGCGCAACTA CCAAACTAAT AATAACCATA CCAGATGCAA TAAATAATAA GTCGTTTCTA 600 
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ATTGTTCCAT 


GCACACCACA 


TAACGTCATA ATTAAAGCGT 


ATAAACTTCG 


CTTTGGTGGT 


720 




TTCTCAGTCG 


TTGGATTATC 


ATCATCATTT 


TTAGTCATCA 


TTTTTTGGAA 


TGGACTGATG 


780 


5 


GCTAAATAAA 


AATAAGGATA 


TAAGACATAA 


ACCCAAACAA 


ATCTAAATAG 


ATAGACAGCT 


840 




AAAGCAACAA 


CAATAGTGAT 


GCCTATTAAA AAGATTAAAT 


TGTGCGGTTC 


TGTTTTGATA 


900 




ATTTTAATAA 


TAACTTCAGG 


TACTAAAAAT 


CCTAATATTG 


AAAAAACAAA 


GCCATTTAAA 


960 




ACATAACCTA 


GTATATTCCA 


TGTATGATTG 


TAACTCATTT 


GCAGTTGTGT 


ACGTACTTGC 


1020 




ATAATTCTGT 


CACGTTCGAA 


ACCATGTACA 


AGTCCTGCAA 


CTACTGCTGC 


AATGATTCCT 


1080 


15 


GATGCGTGaA 


ACAATTCAGC 


AATTAAATAC 


GTAACAAATG 


GTGTTAACAA 


TTGAATAATT 


1140 


GTAAACATAT 


TAATGTTTTC 


ATATCCTCGA 


CGCATCAATG 


TTAATCGGAA 


CCTTACTAAT 


1200 




GCCATACCTA 


TAAGTAAACC 


AACCACTGCG 


CCACCAATTG 


ATGCAATTAA 


AAACAACTGA 


1260 


20 


ACAGCATCAA 


CAAGTGAAAA AGCACCTGTA ACTAATACTC 


CAACAGCTAT 


TTTAAATGAA 


1320 




ATAATACCAG 


CAGCATCATT 


CAATAATGAC 


TCACCTTCAA 


GAATTGTCAT 


TGCTCCTTTT 


1380 




GGCAAGACCT 


TTCCTTTAGT 


GATTGCTTGC 


ACTGCTACTG 


CATCAGTAGG 


ACAAAGAATG 


1440 


25 


GCAGCAATTG 


CAAATGCTGC 


TCCAATAGGT 


AAATCTGGCC 


AAATCCAATG 


AATAAATAAA 


1500 




CCIACACCTA 


TCACAGTAGT 


AATGACTAAT 


CCTAATGCCA 


TCATCATCAC 


TGGCTTAATA 


1560 




TATTTCCTTA 


AATGGACTCT AGAAACATTA ACACCTTCTA 


CAAATAACAA 


AGGCGCAATC 


1620 


30 


ATTGTTACCA 


TAAACAATTC 


AGAATCAAAA 


TTAAATTGAA 


CAGGGATTGG 


GGTAATAAAT 


1680 




AGTAACATGC 


CCAAGAAAAT 


TTGTATAAAT 


GCTAGGGGTA 


CTTTAGGTAT 


GAAAGTATGG 


1740 




ACAAACGAAC 


TTAGTATCAC 


AACAGCTATA 


AATATAAGAA 


TTGTTTCAAA 


TATTTCCAAA 


1800 


CTTTCACCTC 


TCTAAAAAGT 


ATTGTTTAAT 


TGAAAATTAA 


GTATCACATC 


TCGTTGTAAT 


1860 




TATACriTAG 


AGGATAAATT 


GAGTTAGCGA 


CCACAAAAGC 


ACTTTAATAT 


AGATATATGT 


1920 


40 


• 


AGTACTTAAA 


TTTGCAATTA 


TTTAATTTTA 


TTTTATCACT 


AATTGTTTGT 


1980 


ATAAATAAAC 


AACTTGCTTT 


CACATAACAA 


CATTAACTTA 


TAATACAAAA 


AATGAGCACC 


2040 




TTAAAATCGA 


CTAACCAATT 


TCaAAGTACT 


CTTTTAATGA 


TTAATTTTGA 


AAACAGATTT 


2100 


45 


TCaAAAGCAT 


TGTTATGCTT 


AACAATTTAG 


CCAACACTTC 
AATTGTAATG 


AATCGTTTTG 
CTTCTGTAGA 


ATACCATTTC 
GTTTTGTTCA 


2160 
2220 




TTACGATGCT 


CTTCTCGT7T 


TTCAGCACGT 




TTTGAACTTA 


ATAATATTGA 


TGCATGTGTG 


TGAGCATCAT 


TTTTTCGATA 


CATATAAGCG 


2280 


SO 


CCGTTGCGAT 


AAGCAGCGCG 


AGCGACTAAG 


TGCATGCCGA 


CTGGTGAAGT 


TAAATTAATA 


2340 




AAAACAAGTG 


ACAGTAATAA 


ACGCACACTG 


AAAAATCCTG 


TATTCACAAT 


AAAA7AAATT 


2400 
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CTTAAGAAAA CATCTTGGAA 


TTTCACGATA 


CCTATTGCAC 


TAATAAGAGC 


AATAAAACTA 


2520 




CCTAACAACA ACATCACAGC AGCAATAAGA CTAAAGATTT CTTTTGTTAT 


TTCCATTAAA 


2580 


5 


CACATGCCCC CCACCAATAA 


AGCGTGATAT 


TGAAACAGAA 


CTTACAAAAG 


ATATAATGGC 


2640 




AATGAGCATG ATTGAATCTA 


AGAAAGAAAC 


GGTGCCCATA AGTACACTTA ACACACCCAC 


2700 


10 


AATTGACATT ACGACAGCAC 


TTGTTGTATC 


AAATGTAACG 


ACACGATCTG 


CTGTTGTAGG 


2760 


TCCCTTGATT AATCTAAATA AACAGATGAT TAATGCAATT 


CCAAAAATAA 


TGAGTGAACT 


2820 




AATAATCATA ATATGTGTTA TTGTTTGTAT CATCGCGACA 


CCTCCAATAT 
CTGACACGTC 


TAAGTCTTCA 
GATACTATGA 


2380 
2940 


IS 


WW L X An mv> A X \* JL Mr%n 


CAAACTATCT 


TiiiLiiirr 






TTGAGAAATT 


CGTATTACTG 


TAGACCCTGG 


AGTTATAATA 


3000 




ATTAAAATTfJ TTAAAAATGT 


TATTGACCAA 


TCACTTGTTA 


GTCTTGTTTC 


ATATGAAAGT 


3060 


20 


AH.X v>wM.v3VjV9 1 X ^— r^*'^ A ^ i i i 


TGTTTTAAAA 


AGAATATAAT 


TAATCGTGCT 


AATGCTAGAT 


3120 




rtTTATTAATT GATATAAATA 


AACACCTAAA 


AATTTAATAG 


CTACCCATAT 


TTTTCTAACA 


3180 




TAAAAATCAT CGCTGAAAAA 


CCTGTGTAAT 


ATATAAATGA 


CAATTAAACC 


AATTAGATAT 


3240 


2S 


CCAGAAAAGA AAGTCGAGAA 


TTTAAAATGA 


TCTTCATCTT 


GAAATAATAC 


CCATAAGAAT 


3300 




GCAATGATAA TATTTAAAAC 


TATTTGATTC 


ATTTAGTCCT 


CTCCTTTCAA 


ATGCGGATTT 


3360 




ACAAGTTTTT GATATAATTG 


ATCACTCGTG 


TTCAACTCAG 


TTGCATCACT 


TGTAACATTT 


3420 


30 


AACACAACAG GTGCAGCAAT 


TCCGATTGCG 


ATAACCACAA 


CTACTAAAAT 


ACTTAAAATT 


3480 




CTTTTTCGAT ATAGCGGGAT 


TTTCTTAAAA 


TTAACTTCCT 


CCCCATCTTT 


ATCTCCAAAA 


3540 


35 


TACATATAAA AAAGTATCCT 


AAATAAACTG 


TACATTGCAA 


TTAGACTAGT 


AATAATCATT 


3600 


AACGCTAGTC CAATATAATT 


GCCATTTTGC 


AATGCACCTT 


GGAAAATAAG 


TACTTTCCCC 


3660 




GGAAAGCCAC TAAATGGAGG 


CACGCCGCCA 


ATAGCAAAAA 


TCATTATAAT 


AAACGCAACT 


3720 


f w 


CCAAATAAAG GTTCTTTTTT 


AGCTAAGCCA 


TTCAAATATT 


GATATTGTCG 


ATAGCCTGTA 


3730 


ATGTAAACTA AACTACCAAT 


AATAAAAAAT 


AGCAATGTTT 


TTACAACAAT 


GTCATTTACC 


3840 




AAATAAAATA TTGCACCATT 


AATACCTGCA AACGTGTTTG 


TTCCTAAACC 


TAAAATGATA 


39Q0 


45 


AATCCTATTG AGATTATGAC 


TTGGTAAGCT 


GCAATCTTTT 


TAATATCTTT 


ATAAGCAATG 


3960 




ACACCTATAG CGCCGATGAC 


CATAGTTATA 


GCAGCCATAG 


TTGCTAGCAA 


TGGATGTATG 


4020 




AGATCATTAT GTTGATCAAA 


TAGTAAAGTG 


AAGAATCGAA TTAATGCATA 


GGCCCCTACT 


4080 


SO 


TTGGTCATTA ACGCTGCAAA 


TAATGCTGCA AGCTcAGTAT TTAACACAGC GTAGGCTTTG 


4140 




GGTAGCCACA TAAAAAGGAC 


CAGCGCTGCT 


TTCGCACTAA ATGCGACTAA GAAGATTAAT 


4200 
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AAGTTTAATG TACCTACTGT TTTATAAAGT AAACCTATAC CTAATAAGAA TAGCCATGAA 4320 

CCAATAATAT TCAAGACAAC ATAAATAATT GCAGCACGTA ATTGTTCTAC AGATTGTCCA 4380 

AGTGTAATGA GTACAAATGA CGCTAGTAAC ATAATTTCAA ACATGACGTA TAAATTAAAT .4440 

AAATCTGATG TTAGAAAAGA GCCTATCACG CCAACACTTA AAAATAATAT GAACGATGGC 4500 

AAGTGATAAC GATTTGCTTT ATGTTCGCCA CGCCCAAATC CGTATGCCAT AATTAAAGTA 4560 

ATCACAAACG AAGCGGTTGT AACCATAATT AAACTTAAAG AATCTCCTAA AAACTGTA7A 4620 

CCAAAGGGCG CTGACCATCC TCCAAAGTCT AGCGTAATTG GACGGTGACG CTGAACATAA 4680 

ATTAATAGCA TTAATGAAAT AATTGTGGTO ATAGTCATTG TACCTAAGTA TAAATATTTA 4740 

GAAATACGAT CATTATTTTT TAAAAATACA AGGATTAAGG CACAAAGGAA TGGTAATAAC 4800 

ATTGGTAAAA TCAATAAGTT ACTTAGCATC ATCTTCCCCC CTTAGGCCTT CAATTTCATC 4860 

20 TTCTTTTGTT ACTTTATAAG TTCTATAAAC AAGTACAAGT AAAAACGCAG TCATCCCAAA 4920 

CCCTATAACT ATTGCAGTTA GTACAATAGC TTGTAACAM GGATCAACAA ACAATTGGTT 4980 

TCCACCAGTT ATTAGTGGTT CTGATCTACT AGAACCATAC GTTCCCATAC TCATAATAAT 5040 

^5 GAGATTACCA GCATGAGTAT ATATTGAAAT TCCGATTACA ATACGAATTA AATTGATTGA 5100 

TAAAATCATA TATGTTCCTA TAAACACTAA AAATCCTATA ACTAGTAATA ATATTAAATT 5160 

CATGATCGAC CTCCGCTAAG CGACAACATC ACTGTGACAA TAACACCAAC AACTGAGAAT 5220 

AAAATACCTA ATTCAAAAAG TGTTATTGTA CTTACATGAA TTTGTCCTAA AATTGGAAGT 5280 

ATCCAAGTTG* TTTCATATTG AGACAAAAAT GGTTTTCCAA AAAACATAGG TATTATCGCA 5340 

GTAATAGATG ATACCAATGC TCCAATAATC ATTAAAATTC TAAAATCAAT CGGTAAACTT 5400 

TCTAAAACCT CTTCAACATT AAAAGCCAGA AACATTAAAA TAAACGCTGA ACTAAATATT 5460 

AAA^CACCAA TAAACCCACC ACCAGGATTA TTATGACCTG CGAAGAAGAC ATAGAATCCG 5520 

AAAGTCAATA AAATAAATAC AACAAGTTTC GTGACCGTTC TTAACACGAC ATCATTCTCT 5530 

TTCATCTTGT CCCCTCCGAT CTTGATAATT TAATAATGtg TAAATACCTA GCCCAGTAAT 5640 

AATTAACACT AATCCTTCAA ATAATGTATC TAATGCTCTA AAGTCACCAA GTATCGCATT 5700 

4S TACAATATTT TTACCACCTG TTAGTTTGTC AGCTTTTAAA TAAAAGTCTG ATATTGATGA 5760 

TAAACCATCT GTTTGTTGTG TAATAAAAAT TAATGATACA ACAATAAGTG CCATCAAGAG 5820 

TGATACAGAA ATTTTAATTA TTTCTCTTTT TTTGTTAGCX TTAGATCTTG GCACGTTTGG 5 830 

50 TAATCTTGAA AAACTGACAA TAAATAGTAT CGTCGTTATT GTTTCAACTA CTAGCTGAGT 5940 

CAATGCTAGA TCAGGGGCTT TCATTGCTAT AAAGAATAAG GTCACAACAA ATCCGATGAC 6000 
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GACAGTTACG ATTGCTAATA TAATTTCTAA TGCCCCAAAT TCAGAAACAT GTAACTGATG 6120 

TACTTTAGGA AGTCCaATTC GAATATAACC ATATCCAATG ATAATCATAA ATATGCCTAA 6180 

GGTCATAATA ATGTACTGGT TTAAACGATC TTGCATAACA CGTTTAAATC GCTTCGTAGC 6240 

AAACTTTTCA AAATGTCGAT ATACCATCTC ATAGCTTTTT GAAACTGAAA TCTGTCTAAT 6300 

TTTACCTGTG AACACTTTTT TCCAATCTAC TTTGATTGCT AGTACACTAC CCAATAAAAT 6360 

AATGATGATG GTTAAAAGAA GCGGTATGTT AAATCCATGC CATTGCGAAA CATGTGGTGC 6420 

CAATTGATCA ATTTGATGAT TACCACCTGA TACAGCTCTT AATGCnAGAA CGATAATCCC 64 BO 

CTTCCCAAAT ATATnTGGTA CAAAAAAGAT TACAGGTACT AGCACCATTA aTATAAGAGA 6540 

TGGTAAACTA aACAACCATG GTTCGTGGAT ATTTTTTTTA GTAAAAACCT TAGAATCATA 6600 

TTTTGtCCAA AATACTTCTT TTACCATGTA TAGTGCATAT GTGAATGTAA AAACACTCGC 6660 

AATAACACCA ACAAACACGA TAGCTATCAT TGAAATCAAA CTAAATTGGG ATAATTGTCC 6720 

AGTTTGTGTT AATGCATCTA AAAACATTTC TTTACTTAAA AATCCATTTA AAAATGGTAC 6780 

TCCAGCCATA GATAGAGCCG CTATCGTCAT GACTAGATTC ATTTTAGGAA ATAGTTGACG 6840 

25 QKZTClQPi.Q'^i: hPJ^PiTlCQTK TATCCCTTGA ACCTGCTTCA TGATCTAAAA TACCTACTCC 6900 

CATGAAAAGC GCACATTTAA AGATGGCATG ATTCATTAGa TGAAATAGcG CACCArATAA 6960 

TACmAATACA TAAATaGATG CTATTGCGTC TTGTTGGTGT TGAGCATATC CGCCACCTAT 7020 

ACCCACCATA GCCATAATCA TCCCAAGTTG ACTGATTGTA GAGTACGCTA GGATACCTTT 7080 

TAAATCCCAT TGTTTTAAAG CTGTAATTGA ACCAAATAAC ATTGrTATTA AACCAACAAA 714 0 

CGTAACGATA TATACGTACA TATTGCTAnG ACCTAATAAT GGTGTAAATC GAAGTAATAG 7200 

AAnGATACCA GCTTTTACCA TCGTGGCTGA ATGTAAATAA GCACTTACAG GTGTAGGTGC 7260 

AGCttTTGCT CTAGGTAGCC AGTATGAAAT GGAraTTGTG CTGATTTTGT AAATGCACCT 7320 
AATAAAAACA TAAAAATCAT AGGGATAAAC AATCCATGAT TCTTAATATG ATCTGCTTGT . 738 0 

CCTAATATCT CTGTGATGTT ATTCGTTCCT GTCATGATAT ACAGCATAAT AAAACCAACT 744 0 

AATAACGCCA ATCCACCAAA TACTGTAATC ATAAATGATT GAATCGCACC AAATTGACTG 7500 

TCACCATTGT TATACCAATA TGAnATCAAT AAAAATGATG ATmCACTCGT TAATTCCCAA 7560 

AAaATGTACA TCmATATCGT ATTGTCTGAT AATACaaTAC CAATCATACT GAACATAAAT 7620 

AACGTTAAAT AAAAATAAAA CCTTGGTAAA TTGTCTTTTC GAGAGGATAA ATATTGAGTT 7680 

SO GCATAGAAGA ATACTGCAAT TCCAATAAGT GAAATAATAA GAGAAAACAT TAAACTTAAA 7740 

CCATCTAAAC GTAAATCTAA ATTAATATCT AATGTCTTAA TCCATGGAAT AGAGGTAGAA 7800 
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GGTGCAACCA ACGCTATGTA CCCGGCATAT TTAGCCAATG CTCTACGTTT AGACATTAGA 7920 

AGTATCATCG CCATAATCAC AAGTATAGCA ATTAATAAAT AAACCAAACT CATTATTAGC 7980 

CTCCTTTGTT TCTATAATTG TAATGAAATA TAAATACTAT GTTCACACTC ATTTTCTAAA 3040 

CCGATAAAAT TTAGTGTTTC AATAGCAGAT TGATGCCCTA AATACTTTTG AATGACTGGT 8100 

ATAAGTATAC C T TTTTGATA AGCATGATAT GCAAATGTCT TACGCAATGT CGTTAGTCCT 8160 

ACATTATCTA TACCAGCTTC AATTGATGCT TGGTGAATTA TTCGATATGC TTGCTGTCTA 8220 

GATAATACTT GATTTGTTCG TAGTGATTGA AAAAGAACGT CTTCATTCGA AAGACTCCTG 8280 

TCCTCTATAT ATTGAAGTAG TTCTTTCGAT AATGTTTCTG GTAACCTAAT TTTAATCAA 8339 
(2) INFORMATION FOR SEQ' ID NO: 176: 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 58 B base pairs 
20 (B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



■ (xi) SEQUENCE DESCRIPTION: S3Q ID NO: 176: 



GCAACTTCAA ATTGTTGTTC AACAACGTCT TTGATACCTT GCTCATTT 
45 (2> INFORMATION FOR SEQ ID NO: 177: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2341 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



ACT-rrAATCA 


AAAAAGACTC 


SO 


GTAGTTTATA 


TCAAAAAATA- 


120 


AGATTGATTC 


TACAGCATCA 


180 


TTAAATCACT 


AGCTAATGCA 


240 


ATTCATTTGC 


TTTTTCTCTG 


300 


GATGTTCAGC 


TAACTCTTTG 


360 


CTAATTGATC 


AGCATTTAAG 


420 


CAATTTCAGC 


TTTGTCTTTT 


480 


CTTTAGCAAT 


AATTTGTTTA 


540 


GCTCATTT 
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ATAGAGTnCT GGnACTTACT ATGACATATG GCGCTAGAAT GGCTGAGCCA GGTGAATTTA 60 

CAAAACGTGC CTTTTTAAAT GGTCGTATTG ATTTATCTCA AGCTGAAGCA GTTATGGACT 120 

5 TTATTCGCTC GAAGACAGAT AGAGCTTCTA AAGTTGCGAT GAATCAAATT GAAGGTCGTC 180 

TAAGTGACTT AATCAAAAAA CAACGTCAAT CTATATTAGA GATACTCGCT CAAGTGGAAG 240 

TGAATATTGA TTATCCTGAA TACGATGATG TTGAAGATGC GACTACTGAA TTTCTTTTAG 300 

AGCAGTCTAA AGAAATCAAA CAGGAAATTA ATCGTTTATT AGATACCGGT GCGCAGGGTA 360 

AAATTATGCG TGAAGGTTTA TCTACAGTTA TTGTTGGTAA ACCAAACGTA GGTAAATCAT 420 

CGATGTTAAA TAATTTAATA CAAGATAATA AAGCGATTGT AACTGAGGTA GCAGGTACTA 480 

CTAGAGATGT CTTAGAAGAG TACGTCAATG TTCGTGGCGT GCCATTAAGA TTAGTTGATA 540 

CTGCTGGTAT ACGTGAGACA GAAGATATAG TAGAGAAGAT TGGTGTTGAA CGCTCTAGAA 600 

AGGCTCTTAG CCAAGCAGAC TTAATTTTAT TTGTATTAAA CAATAACGAA GCATTGACwC 660 

AAGAAGATTA CACATTATAT GAAGTGGTTA AAAATGAAGA TGTAATCGTA ATTGTTAATA 720 

AAATGGATTT AGAGCAAAAC ATAGATATTA ATGAAGTTAA AGATATGATA GGTGATACGC 780 

CATTAATTCA AACTTCAATG TTAAAACAAG AAGGTATTGA TGaATTAGAA ATACAAATTC 840 

gAGATTTGTT CTTTGGTGGa GAAGTACAAA ATCAAGATAT GACTTATGTT TCTAATTCAA 900 

GACATATTTC ATTATTAAAA CAAGCAAGAC AAACGATACA AGATGCGATT GATGCAGCAG 960 

AATCTGGTGT GCCTATGGaT ATGGTACAAA TTGATTTAAC TAGAACTTGG GAAATATTAG 1020 

GAGAAATTAT TGGTGAGACT GCAAgTGATG AACTCATCGA TCAGTTATTC AGTCAATTCT 1080 

GCTTAGGTAA ATAGTAATTG AAATAGACGG AATACCGTCT TAAGAAGGCT AGTAAGATAT 1140 

3S CAAATAAGGA GGTTTATATT GTGGTTCAAG AATATGATGT AATCGTTATA GGTGCGGGAC 1200 

ATGCAGGTGT AGAAGCAGGT TTAGCATCTG CAAGACGTGG TGCTAAAACA TTAATGCTAA 1260 

CAATAAATTT AGATAATATT GCATTTATGC CATGTAACCC ATCTGTAGGT GGACCAGCTA 1320 

^0 AAGGTATCGT TGTTCGTGAA ATTGATGCTT TAGGTGGACA AATGGCAAAA ACAATCGATA 1380 

AAACACACAT TCAAATGAGA ATGTTAAATA CAGGTAAAGG ACCTGCTGTA AGAGCACTAA 144 0 

GAGCGCAAgc AGaTAAAGTA CTTTATCAAC AAGAAATGAA ACGCGTGATT GAAGATGAAG 1500 

AAAATTTGCA TATAATGCAA GGTATGGTAG ACGAACTTAT TATAGAAGAT AATGAAGTTA 1560 

AAGGTGTACG TACAAATATT GGTACAGAGT ATTTATCTAA AGCAGTAATT ATTACAACGG 1620 

GAACATTTTT ACGTGGTGAA ATCATTTTAG GTAATATGAA GTATTCAAGT GGACCAAATC 1680 

ACCAATTACC ATCAATCACA TTATCAGACA ATTTAAGAGA ACTTGGTTTT GATATTGTTC 174 0 



25 



30 



45 



SO 



55 



858 



IS 



EP 0 786 519 A2 

AAATACAACC AGGTC3ACC3AT GTAGGTCGTG CATTCAGCTT TGAAACAACA GAATATATAT 1860 

TAGATCAATT GCCATGTTGG CTAACGTATA CTAATGCTGA AACACACAAA GTTATCGATG 1920 

5 ATAATTTACA TCTATCTGCA ATGTATTCAG GGATGATTAA AGGAACCGGG CCACGTTATT 1980 

GCCCrrCAAT TGAAGATAAA TTTGTTCGAT TTAATGATAA GCCGCGACAT CAACTTTTCT 2040 

TAGAGCCTGA AGGTCGTAAT ACAAATGAAG TATATGTGCA AGGATTGTCT ACAAGTCTTC 2100 

CTGAACATGT GCAcGTCAAA TGTTAGAGAC GATACCAGGT CTTGAAAAAG CAGATATGAT 2160 

GCGTGCCGGC TACGCAATTG AATATGATGC GATTGTGCCA ACGCAGTTAT GGCCTACACT 2220 

TGAAACGAAA ATGATTAAAA ACTTATATAC TGCAGGTCAA ATTAATGGTA CATCTGGTTA 2280 

TGAAGAAGCA GCAGGACAAG GATTGATGGC AGGTATTAAC GCTGCAGGTA AAGTGTTAAA 2340 

CACAGGCGAA AAGATATTAA GTCGTTCAGA TGCATATATT GGTGTCTTAA TCGATGATCT 2400 

TGTAACTAAA GGTACTAATG AACCTTATCG TTTACTAACA TCACGTGCAG AATATCGTTT 2460 

GTTAcTACGT CATGATAATG CTQATTTGAG ATTGACGGAT ATGGGATATG AACTTGGTAT 2520 

GATTTCTGAA GAAAGATATG . CACGTTTTAA TGAAAAACGT CAGCAAATTG ATGCGGAAAT 2580 

TAAGCGTrTA TCAGATATTC GTATTAAACC AAACGAACAT ACGCAAGCGA TTATTGAACA 2640 

ACATGGTGGT TCTCGCTTAA AAGATGGTAT TTTAGCTATC GATTTATTAC GCAGACCTGA 2700 

AATGACTTAC GATATAATTT TAGAACTTTT AGAAGAAGAA CATCAATTGA ATGCAGATGT 2760 

TGAAGAACAA GTAGAAATAC AAACAAAATA TGAAGGTTAT ATCAATAAAT CACTACAACA 2820 

AGTTGAGAAA GTTAAGCGTA T 2841 

(2) INFORMATION FOR SEQ ID NO: 178: 

35 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3025 base pairs 
Z (B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 178: 

ATCTAATTTC AAACCCGGTG ATAAATTGCC AAGCGTGACG CAATTAAAAG AACGTTATCA 60 

AGTAAGTAAG AGTACTATCA TTAAAGCATT AGGCTTATTG GAACAAGATG GTTTGATCTA 120 

TCAAGCACAA GGCAGTGGTA TTTATGTGAG AAATATTGCT GATGCCAATC GTATCAACGT 180 

CTTTAAGACT AATGGTTTCT CTAAAAGTTT AGGTGAACAC CGAATGACAA GTAAGGTACT 240 

TGTTTTTAAG GAGATTGCAA CGCCACCTAA ATCTGTACAA GATGAGCTCC AATTAAATGC 300 
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CGAATATTCT TATTATCATA AAGAAATCGT GAAATATTTA AATGATGATA TTGCTAAGGG 420 

CTCTATCTTC GACTATTTAG AATCAAACAT GAAACTTCGT ATTGGTTTTT CAGATATTTT 480 

CTTTAATGTA GATCAACTCA CTTCAAGTGA AGCTTCATTA CTACAATTGT CTACAGGTGA 540 

ACCATGTTTA CGTTACCACC AGACTTTTTA TACAATGACT GGCAAACCCT TTGATTCATC 600 

TGACATCGTA TTTCATTATC GTCATGCACA GTTTTATATT CCTAGTAAAA AGTAATAAAT 660 

ACATAAAAAC GTCTATATCC CAGTTATAAA CTGGAGTATA GACGTiTlTT TACGATAATA 720 

ACAATGGCTC AAATTGCTAT TATCTTGCTT AGGTTTTTCG TTTTAGAAGA ATATTGCTAC 780 

AAAGACAGGC ACAACTGCTA CAACAACTAC ACCAACTAAC ACTAAAGCTA TACTTGCCAT 840 

TGATTCTTCT ACAGGTCCTA ATTCTTTGGC TGGTGCTACA CCTAATGTGT GACCACTTGT 900 

TCCAAGTGCT AATCCTCGGG CAATAGGGTT AGTAATTCGG AAAAGCTTTA AGAATTTATT 960 

ACCTAGGGCA TAAATAATGA CACCATTTAA AATAACTGCT AATGATGTTA ATTCTTTTAT 1020 

ACCACCGATA CCAGCTGATA CTGGTAACGC AATCGCTGTA GTTGCTGCTT GAGGTAACAT 1080 

TGATAAAATA ACATCATTGG CAAATTGTGC TAACTTCGCA AAAGTTAAAA TAATTAATAA 1140 

CGCTACAACT GTACCGATAC CAATACCTCC GATGATACGA TGCCAATGTT TAACAAGCAC 1200 

TTCACGCTTT TTATATAACG GAATCGCAAA ACAGATTGTT GCCGGTTCTA AGAAGAAGTA 1260 

AATAATGTCT CCACCTATTT TGTAAGTCTT ATACGGAATG CCTGTTAAAT AGAGGAAGGC 1320 

CACACCAAAT ACCATACTGA CAAATAGCGG TGCGAATAAG AAGAAACGAT TAGTTTTTTC 1380 

AAATAATATG GTCGCTAAGA AAAATGGTAT AACGGATAAC AGTATTCCGA AGTAAGGTGT 1440 

GTTTaGTGCT AAGTGGTTAA TCaTGAGCTT GTGCCTCCTC TATTTTGATC TTTTTTGTGA 1500 

35 CTTTGTCACC TTTAGATCTC GAAGTAACTT 7CATAATAAT TTgTGTGACA TAGCCAGTAC 1560 

AAAT^GTAA TAGTATTGTT GAGACGATTA TTAGTCCAAT GATTAAAAAT GGTGCTTGGC 1620 

TAATGACACC TAAAGAGTTA ACAACTGAGA TACCGGCTGG TACGAAGAGT AAGCCAATGT 1680 

40 TATTTGTTAG TGTCGTTCCT ACTTTTTCGA CTTCGCCTAA CTTAACAGCA CCAGTACATA 1740 

ATAATACAAA TAATAATACT AAACCGATTA CTGATGCAGG CATAGGAATT GGCATAAATG 1800 

ATTCAATTAT TTTCGATACA AAGAGTACTA AAGCAATTAC AATGACTTGG TGAAAAAAGT 1860 

GTGCTGGTTT TGATGCGTCT TTTTGTTGTT TCACGACCAT TGCCTCCTAC GTTTGATTTA 1920 

ACTAAAGTAT AGATGGCTCA CTTCGATTTG CGTGATTTTT AGTCCGAAAT ACAAAATATC 1990 

ATAGGTAAAA TGCATAAAAA AAAGGATTAC TGXTAAAGTA ATCCTATCGA CGCTTTAAAA 2040 

TCTTTCATAA ATGAACGTCC AACTTGCATC TTGACACCAT TTGTCAATAT TACCATATAA 2100 
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TGAATACGTA TAAAATAAGT GGGATTCAAT CGTTTTTCAT AACGATTCAA TGGCTCTGTT 2220 

GTTTCGTATT TATGATTCGT TGTATGTATG GTTGTAATAC CATTATGTGT GCCAATCCCA 2 2 SO 

^ ATAATATTTT GTTGCTTTAA CATGTGAATT TTATCGTCAA TTTCAACAGG TAAGCTTTGA 2340 

TCAAAATTCG CCGACATATC ATTCGCAATT GCACTTGCGT TATTATCATC TTTGGCTrTA 2400 

GTCGCACGCA CTTTATTGAC TGCTTGTTCA ATACGTTTTT GACCAAACGG TTTCAAAATA 2460 

10 

TAGTCTGTCG CATTTAATTC AAATGCCTGT ACTGCGTATT GGTCATGTGC AGTTGCAAAA 2520 

ATAATCGCAG GTGGCTCTTT CATCTTTTGA ATCTTAGCTC CTAATTCGAT CCCATTTTCA 2590 

TCCATTAAAT TGACATCTAA AAATATAATG TCATATTGAT TGATCAGTAG TGCTTCCAAT 2640 

15 

GXTTCTTTTA CATTTTCTGC CTCATTAATT TCTTCAAAAC CACCAATTTC ATTTAATAAA 2700 

TATGTTAATT CATTACGTGC TAATGGCTCA TCATCTATGA TTAATGCTTT CATATTTATT 2760 

CCTCCTCTTG TCTTTCATAA GGAAGTACAC ACCAAAAAGT GGTACCGCTC GATGTCGATT 2820 

20 

CAAATTGTAA TGCTGCGGAT TTTCCAAATA ATCCTTTTAG GCGTAAGTTT AAATTTTCTA 2880 

AAGCACTACC AGTTCCAGAC TCTGATTCTA CAGATGTnTC TCCCaACAAA TGCATTTTAT 2940 

25 CTTTAGAAAT ACCCTGACCA TTATCTTGTA CAATAATAC6 TACATGTGTT GCAGTTTCTT 3000 

TAATCACTGA CACGTCAATA TCGTT 3025 

(2) INFORMATION FOR SEQ ID NO: 179: 
30 ii) SEQUENCE CHARACTERISTICS: 

<A) LENGTH: 1689 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND2DNSSS: double 

(D) TOPOLOGY: linear 

35 

- (Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 179: 

ACAGAATTTC ACAGCATTTT TAGATGAAAA AATAAGCCAG TCATAGCGTT GATTTAACAA 60 

40 

ATGAATATCA AAATTTAGTG GCTTTATATC AATAAAGGGT TTGTGAATAA TTGATACTAA 120 

ATCACTTTGC ATGTCATTTG TTTGTGTCAT AACTACAACT GGCTTCATAT TTAAACGTCA 180 

CTCCATTATT TAATGTTGTT CATTTAAGCG TTTTATAATT TOVTAAGCAC CTTGCTCTTT 240 

45 

TAATTTGTTA CTCACTGTTT TGCCTAACTC AACCGGATCT GTTCCGTTCA TTGTATATTC 300 

AAATCGTTCT TTACCATCTG GGGTCATAAT TAAACCTGTA AATTCGATTT CGTTTTGATC 360 

TGAGATTGTA GCATATCCTG CAATTGGCAC CTGACAACTA CCATCCATTT CTGCTAAAAA 420 

50 

CGTTCGTTCA GCAGTCACAC ATTTTGCAAC CTCATCATTA TGTACTTTGC TTAATAATGT 480 
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TAACAATGTA 


TCTCTATCAA 


GATAAGATGT 


TnCAATATCA 


TCTGACCAGC 


CCATTCTTCT 


600 




TAAACCAGCT 


GCAGCTAAAA 


TAATCGCATC 


ATAATCTTCA 


GTTTGTAACT 


TTTCTAATCG 


660 


5 


TGTATCTATA 


TTACCTCTAA 


TCCATTTAAT 


CTCTAAATTA 


GGATACTTAG 


ATAATATTTG 


720 




TGCACCACGA 


CGTAATGAAC 


TAGTACCAAT 


AATACTGCCT 


TCTGGCAATT 


GGGATAGTGG 


780 


10 


TGTATGTGTT 


TTAGAAATAT 


ACGCATCAAA 


AGGTAATTCT 


CTATCAGGGA 


TACAACCTAA 


840 


TGTTAAACCT 


TCCGGAATTA 


CACTTGGTAC 


GTCTTTAAGC 


GAGTGTATTG 


CCATATCGAT 


900 




ATTTTTTTCA 


AAAAGTTCAT 


GTTGTATTTC 


TTTAACAAAT 


AAGCCTTTGC 


CTCCGACTTT 


960 


15 


AGACAATTGT 


TTATCTAC7A 


TACGATCGCC 


TTTCGTGaCA 


ATTTCTTTAA 


TTTCAATTTC 


1020 




TAGATTTGGC 


TCGACAGCTT 


TTAATTTATC 


AATAAATTGC 


TGGCTTTGTG 


TTAAAGCTAA 


1080 




TTTACyTCTT 


CTGGAGCCAA 


CGACTrATTT 


ACGCATGTTC 


AATTCCTCCT 


AGGAACGGAT 


1140 


20 


TGCTCTAGAT 


TATTTTCTCA ATTCACAAAA 


TGTGTTGCAA 


AAAATAAATT 


AATCATATTT 


1200 




AAGCAAAATA 


AAATAATGTT ATAGTATATT 


AAATATCTTG 


AATTCAACCA 


TTTGTTGATT 


1260 




CTAAGTAAAA 


TATAACTTCC 


ATATAATACT 


GTAATAATTG 


AAGAGAGTAT 


TACCTTCGGG 


1320 


25 


TCAATGAATA 


TACGTTCACC 


AACTGAAATT 


ACACCCCACT 


GTGTACCTAA 


AATAATACTA 


1380 




AATATGAGAA 


TTATCCACCC 


ACTTAACGTT 


GAGTAAAACA 


CAATTGATTC 


AAGTGTAGCA 


1440 




ACGCTACCAA 


TTCTAAAGTA 


TTTTTGATCA 


AAACGTTTTT 


CCTTCAAATT 


ACGGTA i i trL. 




30 


ATGATATACA 


GTAATGCATT 


GACAAAAGCT 


AAGGCAAAGA 


AGACATAACT 


TAACACAGCT 


1560 




AGACCGATAT 


GGACTAACAG 


TAACTCGTCT 


ACAACAGCAA 


rrrrcTGAAC 


CTTATTAGTA 


1620 




TAATGTGTCG 


GTTGAAATGT 


ATTCATCCCT 


AAnAGTGTTA 


ACCCTATTAA 


ATTCCAAGGA 


1680 


35 














1689 
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(2) Information for s3q id no: iso: 

■ 

(i) SEQUENC3 CHARACTERISTICS: 

(A) LENGTH: 1209 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



50 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 180: 

nTGGnTGGCT TTTCCTATTG GACCAAATGG ACCnTTTACC TGGCCnTTCC CAGGACACCC 60 

CGCITGTGCC CACATTCCAA TCGGAAAAGG TGTATGTGGT ACAGCCGTTT CAGAACGTCG 120 

TACACAAATT GTAGCTGATG TTCATCAATT CGAAGGACAT ATCGCTTGTG ATGCTAATAG 180 
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CGATGCCCCT ATAACGGATC GATTTGATGA CAATGACAAa GAaCATCTTG AaGCAATTGT 300 

TAAAATTATT GAAAaGCAAC TCGCATAAAA GGACATCAGC ATTTTCAATA AAGTGTTGAC 360 

5 

AGTTAGCAGG AAAATGTTAC AATAATCTTT GTGTGAATTA ACGAAAGTAG CAGTTGTATA 420 

TTATTGAGCG CTATGTTGTT CCCAATGCGG ACGTGTCACG TAACTGTCGC TATAAGGTGA 480 

AGACACATAA AACAATATAT CTTAGTAAGC ATGCAACACT CTTTTTTGTT TATTCATAAC 54 0 

10 

AACAAAAAAG AATTAAAGGA GGAGTCTTAT TATGGCTCGA TTCAGAGGTT CAAACTGGAA 600 

AAAATCTCGT CGTTTAGGTA TCTCTTTAAG CGGTACTGGT AAAGAATTAG AAAAACGTCC 660 

TTACGCACCA GGACAACATG GTCCAAACCA ACGTAAAAAA TTATCAGAAT ATGGTTTACA 720 

15 

ATTACGTGAA AAACAAAAAT TACGTTACTT ATATGGAATG ACTGAAAGAC AATTCCGTAA 780 

CACATTTGAC ATCGCTGGTA AAAAATTCGG TGTACACGGT GAAAACTTCA TGATCTTATT 840 

AGCAAGTCXST TTAGACGCTG TTGTTTATTC ATTAGGTTTA GCTCGTACTC GTCGTCAAGC 900 

ACGTCAATTA GTTAACCACG GTCATATCTT AGTAGATGGT AAACGTGTTG ATATTCCATC 960 

TTATTCTGTT AAACCTGGTC AAACAATTTC AGTTCGTGAA AAATCTCAAA AATTAAACAT 1020 

25 CATCGTTGAA TCAGTTGAAA TCAACAATTT CGTACCTGAG TACTTAAACT TTGATGCTGA 1080 

CAGCTTAACT GGTACTTTCG TACGTTTACC AGAACGTAGC GAATTACCTG CTGAAATTAA 114 0 

CGAACAATTA ATCCGTTGAG TACTACTCAA GATAATACGG TCAATACCAA CACCCACAAT 1200 

30 TGTGGGTGT 1209 
(2) INFORMATION FOR SEQ ID NO: 181: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 6 98 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 
- (D) TOPOLOGY: linear 



40 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 181: 
AAATCCCTTC GTtaAAgTsC AAAtTTTTCc AACrgCTTTA AtArGACCCA TATTACCtTC 60 
TTGGATTAAA tCmAGGaATG AcATACCACG ACCaCGTATC TTTTAGCAAT ACTTACAACT 120 

45 

AAACGTAAGT TCGCTTCTGC AAGTCTTGAT TTTGCTACTT CATCACCTTG TTCAATACGT 180 
TTGGCTAATT CGATTTCTTC TTGTGCACTT AATAAGTTAA CACGCCCAAT TTCTTTAAGG 240 
TACATACGAA CTGGGTCATT TATTTTAACA CCTGGAGGGG CACTAAGATC ACTTGGATTC 300 

SO 

AGTTTCTCGT CAGTATCTGA ACTATCTTTT TCATTAACTA GTGAAATATC ATTATCATTT 360 
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GCAATTTCTT 


CATGACTTAA 


ATGACCCTCT TTTTTACCTT 


TTTCAATTAA 


TTGCTTCTTA 
TGTGTTATCA 


480 




ACATCTTCTA 


ATGTTAATGT 


CGGATCAATT GTTTGTTTTT 


TAATTTTAAC 


540 


5 


GACATGAAAC 


GGCCTCCCGA 


TTTTAAATAT GAACATTCGA 


AATTTATTCA 


ATATTGCTAT 


600 




TTTAAACGAA 


ATTCTTAATT 


AATTCCATCC ATAlTi'IVlAA 


TTTTATTTTA 


CAAATTGGGA 


660 


10 


ACTAAATCCC 


CAATATTTAT 


TTTTCAATAG TGGTGGTT 






698 


(2) INFORMATION FOR SSQ ID NO: 182: 








15 


(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 5147 base pairs 

(B) TYPE; nucleic acid 
<C) 5TRANDSDNES5 : double 

(D) TOPOLOGY: linear 








20 


(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 182: 








ACTTGATGAT 


GTATACAATG 


TATTTCAAGA ATATTATCAA 


AAAACATCTA 


ACATTAAGTT 


60 




TTGTAGAATT 


CACAATTCTA 


GCTATTATCA CTTCTCAAAA 


TAAAAACATC 


GTTCTTCTTA 


120 


25 


AAGATTTAAT 


TGAAACAATC 


CACCATAAAT ACCCTCAAAC 


TGTTAGAGCT 


CTCAATAATT 


180 




TAAAAAAGCA 


AGGCTATCTA 


ATAAAAGAAC GCTCAACTGA 


AGATGAAAGA 


AAAATTTTAA 


240 




TTCATATGGA 


TGACGCGCAG 


CAAGACCATG CTGAACAATT 


ATTAGCTCAA 


GTGAATCAAT 


300 


30 


TATTAGCAGA 


TAAAGATCA? 


TTACATCTTG TTTTTGAATA 


ATATCTCTAT 


TACGCAAGTG 


360 




TGCTGTATTC 


TAAAGTGCAC 


TTGTGTTTTC TATTTTTTAA 


TAAAACCTCA 


GCACATAATG 


420 




AACAACTTTC 


TATTTTCTAT 


ATOVCTTAAA ACCATTTCCG 


AAATTAAACC 


TCAGCACATT 


480 


35 


CAAAGCCCCA 


CTTTATTCTT 


AAAAATATTT TTTAACTCAT 


ATGTATTAAA 


CCGCTTTCAT 


540 




TATAAAAAAT 


ATCTCTATAT 


TtTATCTGCT TtTATTAATC 
GAATAAATCT TTCAGCAAAA 


GAAATAGCGT 


GATTTTGCGG 
ATAAGTTGTA 


600 
660 


40 


TTTTAAGCCT 


TTTACTTCCT 


TATTTATTTT 


AAACTTACCT 


TTAAATTTAA 


TTATAAATAT AGATTTTAGT 


ATTGCAATAC 


ATAATTCGTT 


720 




ATATTATGAT 


GACTTTACAA 


ATACATACAG GGGGTATTAA 


TkTGAAAAAG 


AAAAACATtT 


780 


45 


ATTCAATTCG 


TAAACTAGGT 


GTAGGTATtG CATCTGTAAC 


TTTAGGTACA 




o ^ u 


CTGGTGGCGT 


AACACCTGCT 


GCAAAtgctG CGCAACACGA 


TGAAGCTCAA 


CAAAATGCTT 


900 




TTTATCAAGT 


CTTAAATATG 


CCTAACTTAA ATGCTGATCA 


ACGCAATGGT 


TTTATCCAAA 


960 


SO 


GCCTTAAAGA 


TGATCCAAGC 


CAAAGTGCTA ACGTTTTAGG 


TGAAGCTCAA 


AAACTTAATG 


1020 




ACTCTCAAGC 


TCCAAAAGCT 


GATGCGCAAC AAAATAACTT 


CAACAAAGAT 


CAACAAAGCG 


1080 
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AAAGTCTTAA AGACGACCCA AGCCAAAGCA 
ACGAATCTCA AGCACCGAAA GCTGATAACA 
^ ATGAAATCTT GAATATGCCT AACTTAAACG 

TAAAAGATGA CCCAAGCCAA AGTGCTAACC 
CTCAAGCACC GAAAGCGGAT AACAAATTCA 

10 

TCT7ACATTT ACCTAACTTA AACGAAGAAC 
ATGACCCAAG CCAAAGCGCT AACCTTTTAG 
CACCAAAAGC TGACAACAAA TTCAACAAAG 

75 

ATTTACCTAA CTTAACTGAA GAACAACGTA 
CTTCAGTGAG CAAAGAAATT TTAGCAGAAG 
AAGAGGAAGA CAATAACAAG CCTGGCAAAG 

20 

ACAACAAGCC TGGTAAAGAA GACAACAACA 
GCAAAGAAGA CGGCAACAAG CCTGGTAAAG 
GCAAO^AGCC TGGTAAAGAA GACAACAAAA 
GCAAAGAAGA TGGCAACAAA CCTGGTAAAG 
CTGGTGATAC AGTAAATGAC ATTGCAAAAG 

30 CAGATAACAA ATTAGCTGAT AAAAACATGA 

AGAAGCAACC AGCAAACCAT GCAGATGCTA 
AAGAAAATCC ATTCATCGGT ACAACTGTAT 

35 CGTTATTAGC TGGACGTCGT CGCGAACTAT 

ATTTXATCCA AACCAATTTT AACTTATATA 

TAAGAATCAT CTAAATGCAC GAGCAACATC 

40 

TTACTTTTCT AAACAACTTC TGAAACGCCT 

CATTTTTAGG CATTAAAAAA TCGAACTAGA 

GATTCATGAA TAATTAGATT TAAAATGTCA 

45 

TTAGAATATT AACGTTAGTA TAAACGTCCA 

GTATTTTAAC GTCATTTTTA ATAATGCAGA 
CGCAATGGCA ATTGATTGTG GTGAAATAAG 

SO 

TGCCACAAGT AATGAACCGC TTGTTGAAAT 



CTAACGTTTT AGGTGAAGCT AAAAAATTAA 1200 

ATTTCAACAA AGAACAACAA AATGCTTTCT 1260 

AAGAACAACG CAATGGTTTC ATCCAAAGCT 1320 

TATTGTCAGA AGCTAAAAAG TTAAATGAAT 1380 

ACAAAGAACA ACAAAATGCT TTCTATGAAA 1440 

AACGCAATGG TTTCATCCAA AGCCTAAAAG 1500 

CAGAAGCTAA AAAGCTAAAT GATGCTCAAG 1560 

AACAACAAAA TGCTTTCTAT GAAATTTTAC 1620 

ACGGCTTCAT CCAAAGCCTT AAAGACGATC 1680 

CTAAAAAGCT AAACGATGCT CAAGCACCAA 1740 

AAGACAATAA CAAGCCTGGC AAAGAAGACA 1800 

AGCCTGGTAA AGAAGACAAC AACAAGCCTG 1860 

AAGACAACAA AAAACCTGGT AAAGAAGATG 1920 

AACCTGGTAA AGAAGACGGC AACAAGCCTG 1930 

AAGATGGTAA CGGAGTACAT GTCGTTAAAC 2040 

CAAACGGCAC TACTGCTGAC AAAATTGCTG 2100 

TCAAACCTGG TCAAGAACTT GTTGTTGATA 2160 

ACAAAGCTCA AGCATTACCA GAAACTGGTG 2220 

TTGGTGGATT ATCATTAGCC TTAGGTGCAG 2280 

AAAAACAAAC AATACACAAC GATAGATATC 2340 

CGTTGATTAA CACATTCTTA TTTGAAATGA 2400 

TTTTGTTGCT CAGTGCATTT TTTATTTTAC 2460 

CAACACTTTC TACTCTGATT ACATATATGA 2520 

CAAGATGCTC ATTGCATTTC GTACTAGTTC 2580 

TTTGAATCCA AGTGACAACA TTATTTATAT 2640 

AACACAAATA AAAGCAACAA ATATAATACT 2700 

TTCTTCACCA ACTTTTTTAA CAGCTGCAGT 2760 

TTTCGCTGCT ACACCACCTG CAGTGTTAGC 2820 

TTGTTGTGCC ACTGTCGCTT GAATAGGTGC 2880 
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10 



15 



20 



25 



30 



35 



40 



45 



SO 



TGGAGAGAAT AATGGGAAAA TTGCTCCCGC TTTAGCAATA CCTTGTCCAA TTGCTACAGT 
CAAACCACCG TATGTCATAA CTTTAGCAAT AGCTAGGATA GCTGAAATTG TAAGGATCGG 
TAACCATAAT TCTTTAATTG CTTCGACCAA TAAAGCACCT GCACTTTTCC ATTTTAACTT 
CGTAATTAAA ATTGTAATAA TTACTGTTAA TAAAATCGCT GTCCCAGTTG CACCAATTAA 
ATCGAGACGC AACGCAATTC CTTTAGGCGA TAAATCACTC ACAGTATTTG GAATTGGCAA 
TTTTATTACT AAACTTTCAA GTGCACCTCC AGGTTGGAAT AATTTTTTGA AGAATGGTGC 
ACTCCATACT' AATACAAAGG CAGTTAAAAT TACGAACGGA CTCCAAGCAA AGACAATTTC 
TTTAGGCGTT CGTTTTTGAA TTTTATGTTC AGACGCTTCC AATCTGAAAA TGTTTTTCGG 
TTTAAATrXA CGACAAACAA ATGCTAACAC CACCATTGTT GCTAGTGATG GAATAATGTC 
TGCTAGTTCT GGACCATGGA ATATTGTTAA TAATAATTGT AATCCAGTAT ATGTACCACT 
CACTGTTAAA ATGACAGGTA AAATTTCTTT AATACCTTTC ATACCATCTA CAATGAATAC 
TAAAACAAAT GGAATAATAA AGTTTAAAAT TGGAAGTGTT AATGCTGAGT ATCTCGCAAC 
ATCTAATGTT GTAACGCCTC CACTTAAGTT AAACGTATCA ATAATACTAA CTGGTAAACC 
AATTGCACCA AAGGCACCCG CCGCACCATT AGCAATTAAA CATAACATCG CTGCTTTTAA 
TGGTTCAAAT CCAAGTTGAA TTAATAATAC TGCACAAATC GCAATTGGCA CACCAAATCC 
TGCTGCACCT TCTAAAAATG CGTTGAAACA AAATCCAATT AATAATAGTT GGATTCTTTG 
GTCCACTGAA ATACTTGCAA TACTATCTTG AATAATAGAA AATTGTCCTG TTTTAATAGA 
AACTTTATAT AACCAAACTG CCATTAAAAC GATATATCCT ATTGGGAAAA TACCGGCAAC 
AACGCCTTCT GTAATCGCAC CTGCTGATAC ACGCGCTGGT AATTCAAATA CAAATAAAGC 
CACAATCAAT GTAACAACCA AAGTTGTCAA TGCTGCATAA ATGCCTTTCA TTTTAAAAAC 
GGTT&AGCAT AATAAAAATA AAATAATAGG TACTGCTGCA ACTAAGGCTG ATAATCCGAC 
ATTATCXSAAT GGATTTACAG TAAGTAGTGT CATAATGACT CCCTCTCTTT ATATAAAATA 
TTTATCATTC TGATTAATCT ACAACCTATT TCAACTTATA TTTTGCGATG ATCACATATT 
TAAAATGTAA CACTCCTATA TGTGACAGGC AATCGAATTT TTACAAAAAG TTCACAAAAT 
ATACACAATA TTTAACTATA ATAmATAATA TATCaTntTA ATTATAAATA CTAGATATTA 
TTTATAATAA TCTCAGGAAT TCGCTTCAAA ACTGCATCAT GAGAGTTTAT ATTTTTATTG 
AGAATCTCTC ATTTTATGAA TTGTAGGAAG TAAACAAAAT ATGACAAGCG TCAAACCAAT 
GATAATGATA AATATCATAT TAAACCATAG TAAATTGAAT TGATGATGGT GTTGTATTTG 
CCAAATTTCT AATACTGTGA AGATAGACAT ATAGCTCATA ATCTCTAAAT TTAAGGTACT 
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AAATCGTTCA TAGTATCTAC CTGCAATGAA AAATATAAGC CAAATCACTA TAAATGCGCT 4800 

ATTAATCAAA AGCAGCACCC ATTTATCAGC AAAATTATCA GCATCCCCTG CTAAATTATA 48 50 

ATGAATAGGC ACTTTGGTTG GTAATTTTGG ATAGGTCACT ACTGTATAGC ACATCATAGC 4920 

TAAGTAAATA AGTAGACTTA ATATTGTAAA AGACCTGATT TTAGACATTC TATCGCCTcT 4980 

TcTTTACATT TTATGTATAA CACTCTGCCT ATTTTACCTT TTAATaCATT ACCCCAAcGA 5040 

TtAAaCAATA tGTAaTGATA CTATAATTGC GTCAGGAGTA TCCGCTTGTT AAATGTGCAT 5100 

AGCTTATATT TAGCTGTTTA ACATGCCACA TAATGATTCG AATTATT 5147 
(2) INFORMATION FOR SEQ ID NO: 183: 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1312 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

20 (D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 183: 

CACTTACTTC CACCATTATC ATAACTTTAA AATGGATATA nTTCATCAAA CATTATCTAA 60 

AGGCGTCGCA CCTACACCAA CACCATCCAA CAATTAACTT ACAACTCTGC GATTACTTCT 120 

TCAGCAGCAA CTTTCACnTG CGTAATACAA TCAGGTAGTC CAACCGCTTC AAAAGATGCA 180 

CCAGTTACTC TAAGTCGTGG ATATGTTTGT TTAATATGTG CTTGAATCTG TCTAATTTGT 24 0 

TGAATATGAC CGACATGGTA CTGTGGCATA CTTTTCGGCA AACGATTGAC AATTGTAAAT 300 

TCAGGATCAC CTTTAAATGT CATCATTTGA CTTAAATCTC TACGTACAAT CGATACTAAT 360 

TCATTATCTG TATGATCATC AACCACAGTA TCACCTGGTT TACCTACATA CGCACGAATC 420 

AAAffiCTTAC CTTCCGGTGT AGTAAATGGC CATTTTTTCG ATGTCCAAGT ACATGCGGTA 4 80 

ATGtCTGTAT CACTCGTTCT CGCAATTACG AAGCCAGTAC CATCATGGGT ATTTTCAATG 54 0 

TCTTTTTCAT CAAATGCCAA TACAACAGTT GCAACAGTCG TACTATCCAT CGTTTTAAAG 600 

TAATCAAATG CTGGATCTTG TCCGAACCAA TTTAAAAACA CTTGATGTGG TGTCGTTACT 660 

AATACGCCAT CATACACTTC TTCTAGTTGA TCATTGTAAA CAATTTTATA TTGTTTTTGA 720 

GATGTAATTA TAXCATCCAC TGACGTATTG TAGCGTATTG TCACACCTTT ATTTTTAACA 7 80 

TCTTGTTCTA ATGCTTCAAT AAATGAGCTT AAACCATGCT TAAATTGTTT GAATTGTCCT 840 

TTCGGTGCGC CAGGATATAA TTGTCTTTGT TTCAGACGCT TATTTTTCTC ATCCTTCATA 900 

CCTTTTATCA GACTTCCGAA TGCCTCTTCT TTTTCTTTAA AATTAGGAAA CGTACTCATC 960 
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TCAAGTACCT CATTACCTAA TCTTGCTCTG AAAAATGCAC 


CAACAGAAAT 


GTCACCATCC 






TGCATTTGAG TAGGTTTTTT TAATAAATCA AACCCTGCTC 


TTAATTTACC 


aagtggcgat 


1140 


5 


ATTAATTTTG TAGTAACAAA TGGTTTAATA . TCTGTTGGAA TACCCATAAT 


tgaaccacct 


X 4 u 




GGAATCGGAT ATAATTTATT TTTCGCAAAA ATATATGATT 


GTCCAGTCGT ATTTGTAACA 


1260 


10 


ATATCTTGTT CTAATCCAAT ATCTTTCGCT AATTCTGTCA 


taatcgtttt 


TC 


1312 


(2) INFORMATION FOR SEQ ID NO: 184: 




- 




15 

• 


(i) SEQUENCE CHARACTERISTICS: 

{A> LENGTH: 6157 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 




* * 


- 


20 


(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 184: 








TTTTACAATA AAAATATGAT ATACTACTTG TCGTATATAA 


ggaacggagg 


acaatttatg 


oO 




CATACATTTT TAATCGTATT ATTAATCATT GATTGTATTG 


CATTAATAAC 


tgttgtacta 


120 


25 


CTCCAAGAAG GTAAAAGCAG TGGACTTTCA GGTGCCATCA 


^^^n^^ 

gtggtggtgc 


tgagcagtta 


180 




TTCGGTAAAC AAAAACAACG TGGCGTCGAT TTATTCTTAA 


atagattaac 


aattatttta 


240 


30 


TCAATATTAT TTTTTGTACT TATGATTTGC ATAAGTTATC 


ttggtatgta 


AGGTCCGvjCG 




ATGTAAATGT CGGGCTTTTT TATTTATAAT TAAGAATGTA 


atagtttaac 


AATAAGCTAT 


T CA 




GTAAAATATA TAGCCTAGTT AAGTATGCAA AGGGAGCGTT 


agatttatgc 


AGAXAAAAi i 


A o n 


35 


ACCAAAACCT TTCTTTTTTG AGGAAGGTAA ACGTGCCGTG 


ttattactac 




>i o n 
4oU 




AGGCAATTCG TCTGATGTTC GTCAATTAGG TCGATTTTTA 


caaaagaaag 




C A A 




ATAIECACCG CAATATGAAG GCCACGCGCC ACCACCAGAT 


gaaatactga 








* 

TTTCGTTTGG tttaaagatg cgttagatgg ttatgattat 


cttgttgaac 


aaggttatga 


O D V 




TGAAATTGTT GTTGCTGGTC TATCATTAGG TGGGGATTTT 


gctttaaaat 


taagcttaaa 




45 


TAGAGATGTA AAGGGTATTG TAACGATGTG TGCTCCTATG 


ggtggcaaaa 


ctgaaggtgc 




CATTTATGAA GGCTTTTTAG AATATGCAC:a QIAAXlTIAAA 


aagtatgaag 


gtaaagatca 


O *t V 




AGAGACTATT GATAATGAAA TGGATCATTT TAAACCAACT 


gaaactttaa 


aagaactaag 


900 


50 


TGAAGCATTA GATACGATTA AAGAGCAAGT TGATGAAGTG 


ttggatccta 


ttttagtgat 


960 




TCAAGCAGAA AACGACAATA TGATTGATCC ACAATCCGCA 


aattatatat 


ATGACCATGT 


1020 




AGATTCTGAT GACAAAAATA TCAAGTGGTA CAGTGAATCT 


ggacatgtta 


ttacgattga 


1080 
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AOPATPiPiPiAA GAGATTTTAA CATTAGAAAG GAGGGGCATA ATGAATTTAA AGCAATCTAT 1200 

AGAAGAGATT ATTAATCAAC CTGAATATGA ACCTATGTCA GTGTCAGATT TTCAAGATGC 1260 

ATTAGGTTTA AGCAGTGCCG ACTCGTTTAG AGATTTAATT AAGGTGCTTG TGGAGTTAGA 1320 

ACAATCAGGA TTAATCGAAC GTACAAAAAC AGACAGATAC CAAAAAAAGC ATAGTTATAG 13 BO 

AGGTCAATCA AAATTGATAA AAGGAACGTT AAGTCAAAAT AAAAAAGGCT TXGCATTCTT 1440 

AAGACCTGAA GATGAGOATA TGGAAGATAT ATTTATTCCC CCGACGAAAA TTAATCGTGC 1500 

CTTGGATGGA GATACTGTTA TTGTAGAAAT CCATCAATCA AAAGGTGAAC ATAAAGGTAA 1560 

AATCGAAGGG GAAGTTAAGT CGATTGAGAA GCATTCTGTA ACTCAAGTrG TTGGTACGTA 1620 

TAGTGAAGCT AGACATTTTG GCTTTGTTAT TCCGGATGAT AAACGTATTA TGGAAGATAT 1680 

TTTCATTCCT AAAGGTCAAA GTTTAGGCGC AGTCGATGGT CATAAGGTAC TTGTAGAAAT 1740 

20 TACTAAGTAT GCTGATGGTT CAGATAATCC AGAAGGACAT ATTTCTGCTA TTTTAGGACA 1800 

TAAAAATGAT CCTGGCGTAG ATATTTTATC TATTATCTAT CAACATGGCA TAGAAATTGA 1860 

ATTTCCTGAT GAAGTGTTAC AAGAAGCTGA AGCAGTACCT GATCATATTG AAAATACTGA 1920 

AATTAAAGGC CGTCATGATT TACGTGATGA ATTGACAATC ACAATTGATG GTGCTGATGC 1980 

TAAAGACTTA GATGACGCAA TTAGTGTTAA AAAGTTAGCG AACGGTAATA CGCAATTAAC 2040 

TGTAAGTATT GCTGATGTCA GCTATTATGT AACAGAAGGT TCTGCATTGG ATAAAGAGGC 2100 

ATATGATAGA GCGACAAGTG TATATCTTGT TGACCGTGTA ATTCCAATGA TTCCACATCG 2160 

ATTAAGTAAT GGTATTTGTT CATTGAATCC TAATGTTGAT CGTTTAACTC TAAGCTGTCG 2220 

CATGGAAATC GATGCTAGTG GTCGCGTTGT TAAACATGAA ATTTTTGATA GTGTTATACA 2280 

TTCTGATTAT CGAATGACGT ATGATGCGGT AAATCAGATT ATTACTGAAA AGGATCCTAA 2340 

CATTCGCGAA CAATATAATG AAATTACGCC TATGCTAGAT TTAGCACAAG ATTTATCTAA 2400 

TCGTTTGATT CAAATGAGAA AACGACGTGG TGAAATCGAT TTTGATATTA GTGAAGCAAA 2460 

AGTATTAGTT AACGAAGACG GTATACCAAC AGATGTTCAA TTAAGACAAC GTGGCGAGGG 2520 

TGAACGTCTA ATTGAATCAT TTATGTTAAT TGCAAATGAA ACAGTTGCTG AACATTTTAG 2580 

TAAGTTAGAT GTACCTTTTA TTTACCGAGT GCATGAGCAA CCTAAATCAG ATCGCTTAAG 2640 

ACAATTCTTT GATTTTATTA CAAACTTTGG CATCATGATT AAGGGTACTG GCGAAGATAT 2700 

TCATCCAACA ACACTTCAAA AGGTTCAAGA AGAAGTAGAA GGTCGACCTG AACAAATGGT 2760 

CATTTCAACA ATGATGTTGC GTTCAATGCA ACAAGCGCAT TATGATGATG TGAACTTGGG 2820 

ACATTTTGGC TTATCAGCTG AATATTATAC GCATTTTACA TCACCAATTA GACGTTATCC 2880 
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AGAAGTGAAG CGTTGGGAAG ACAAATTGCC TGAGTTAGCT GAACATACTT CTAAACGTGA 3000 

ACGTCGTGCT ATTGAGGCAG AACGTGATAC TGATGaATTG AAAAAAGCAG AAXATATGAT 3060 

TCAACATATT GGTGATGAAT TTGAAGGTAT TGTCAGCTCA GTAGCTAACT TCGGTATGTT 3120 

CATTGAATTG CCAAATACGA TAGAAGGTAT GGTTCATATT GCGAATATGA CTGATGATTA 3180 

TTACCGTTTT GAAGAGCGTC AAATGGCATT AATTGGTGAG CGTCAAGCTA AAGTATTTAG 3240 

AATTGGTGAC ACAGTTAAGG TTAAAGTGAC GCATGTTGAT GTAGATGAAC GATTAATTGA 3300 

TTTTCAAATT GTAGGTATGC CTTTACCGAA AAATGATCGA TCACAGCGCC CAGCGCGAGG 3360 

TAAGACAATT CAAGCCAAAA CGCGTGGTAA ATCATTAGAT AAATCAAAAT CTGATGATAA 3420 

GGGTCGTAAG AAAAAAGGTA AGCAACGTAA AGGTAAAAAC CAACGTAATA ATGATAAATC 3430 

AGGTAATAGT AAGCATAAGC CATTTTATAA AGATAAAAGT GTGAAAAAGA AAGCACG7CG 3540 

20 TAAGAAAAAA TAAGCAGCAA TGAGGTGAGT ATGAATGGCT AAGAAGAAAT CACCAGGTAC 3600 

ATTAGCGGAA AATCGTAAGG CAAGACATGA TTATAATATT GAAGATACGA TTGAAGCGGG 3S60 

AATTGTATTG CAAGGCACAG AAATAAAATC AATTCGCCGA GGTAGTGCTA ACCTTAAAGA 3720 

TAGTTATGCG CAAGTTAAAA ACGGTGAAAT GTATTTGAAT AATATGCATA TAGCACCATA 3730 

CGAAGAAGGG AATCGTTTTA. ATCACQATCC TCTTCGTTCT CGAAAATTAT TATTGCACAA 3840 

GCGTGAAATC ATTAAATTGG GTGATCAAAC ACGTGAGATT GGTTATTCGA TTGTGCCGTT 3900 

AAAGCTTTAT TTGAAGCATG GACATTGTAA AGTATTACTT GGTGTtGCAC GAGGTAAGAA 3960 

AAAATATGAT AAACGTCAAG CTTTGAAAGA AAAAGCAGTC AAACGAGATG TTGCGCGCGA 4020 

TATGAAAGCC CGTTATTAAG CGATTTAGTT GCTTAATCGG GCTATATTTG ATATAGTTAT 4080 

ATGTGCTTTT GTAAATTACA AAAGTATGAT TTGTTTGATT TATTATTTCG GGGACGTTCA 4X40 

TGGA7TCGAC AGGGGTCCCC CGAGCTCATT AAGCGTGTCG GAGGGTTGTC TTCGTCATCA 4200 

40 ACACACACAG TTTATAATAA CTGGCAAATC AAACAATAAT TTCGCAGTAG CTGCCTAATC 4 260 

GCACTCTGCA TCGCCTAACA GCATTTCCTA TGTGCTGTTA ACGCGATTCA ACCTTAATAG 4320 

GATATGCTAA ACACTGCCGT TTGAAGTCTG TTTAGAAGAA ACTTAATCAA ACTAGCATCA 4380 

TGTTGGTTGT TTATCACTTT TCATGATGCG AAACCTATCG ATAAACTACA CACGTAGAAA 4440 

GATGTGTATC AGGACCTTTG GACGCGGGTT CAAATCCCGC CGTCTCCATA TTTGTAGCCT 4500 

ACAGCCTTTG TGGTTGTGGG CTTTTTTATT TTGTGTTTTT CAGGGGATAA TGCATTGCAG 4560 

AATTTGTTGT GAGTATTGAT ATAGCAGTGT TTGTATAGGT GTTTATTTGA TGGAGGAAAG 4620 

AGTAATAAGT GATTATGAAT TAGTTTTTGA GATATAAGGG GACAGTGATG TGTGTCAAAT 4680 

55 



30 



35 



45 



SO 



870 



EP 0 786 519 A2 

TTATACGCAA AAAATTCTCC ATGTTATATA TGTCAATATA AAAATGTGAA TCGTCTACAC 
TTAATTGGAT AAATGGCTAC TGAAAAAGAA CTTTTCATTT TTGTTACGTC ACTAAGTGGG 
TGTAGTTATA AAGAGATGAG CCGAGTTTTG ATATTTTCAT TAGAATCAAT ATGCCTATTA 
ACACAATCAG CAATAGTTGA CGAGACGGAA ATAAAAGAAG TCGTAGTTAA GAAATGCATT 
TCACAACATA CCATTGTAGC CATTTTTATT GTTTTGGATG ATAAACTCTT TTTGGAATTT 
TTAGTTTTTA TAATTTGCAA CTACACTACT TCTTTTACTA ATATTAATGT CTAAGTAATC 
GATAAAAAAT TTTCCATTGA ATAAATGAGA AGTTAAAAAC TTTACTTAAC CTTTCycATT 
GCATTTTCCT ATTCACGATT TTAAGAACCC AACATACTAC AAACGAATTT TAAAAGGCGA 
GAGTAAAGCT TACTTGTTTA TTATACATAT TTAAAATCCA AGAGTCAGAA CAGACTACTC 
CTCTTTATAA CTATAAAAAA TAGCTATGAA AAAATCTATC GTCATAGATT CCTTCATAGC 
TAATCTTAGT ATGTTTATTT TTATTTTAGG ATGCTATTTA TCAACTCAAC ATATAACTCA 
CTATTTTTAT AACCTTCTAA TATATCATTA ACTTGTCTAA TAGGTATTTC TGGTACTTCT 
CTAATGTTTT CCAATTTTGT TTTAAATTGT TTTTTTGTTA TTTGCTCTTT ATTTGTAGCC 
AATTGGAACA AGTAAGAATC TAGCATATTA ATTTCTTTAT ATGAATACAT ATATCTTAAT 
AACACTAAAT CTCTAGTTTT TAAGTTAGGC GCTAGTTCTT CTTGTAATTG TTCTATTGAT 
TGTyTCATTA ATAACAATCT CATTTCTAAT TCTTCATTAT TCATTTTATC ACACTCTTtT 
TATATTAATG CTTGACCAAC TTGGGAAACC CAAAACCCTA TGCTTCTTGC AGTAGAATCT 
TTAATACCAG TTCCCATCAA TGCTTGTGAA ACTTGACCTT GTACATTTCC CCATGTAGCC 
TCTTCTTGTT TTAATGCATT ATTCAATGCG GGATTTACAA ATTTATCCCA TCTTTTTTTT 
ATGATTTTCC GGCACGGGGA CTGATTTCTT TAACACCATT AAACACAGAT TTTTTATTTT 
TAATS^ATAGC TTTATAGTAT CATGTTGGCT AAGCTATAAA TAAGTCAGTT TCTCTAAAAA 
TTAAATAACT GAATGTAAGA CAATCAACAA wCCAAATTTA TACTTCATCT AAACCACTGT 
GGTCGTCATC TTTTTGCTTT TCTTTTTCTT TCTCTCGTTC TTGTTCTTTT TTGTACTCTT 
CTTCAAATTC TTTTTCTTTC TTTTCTACTT CTTCTCT 
(2) INFORMATION FOR S2Q ID NO: 135: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 884 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 
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O^TTTGTTAT TCTGAGTAGC CAATTTGGCA AAGATGAACA AACGTCTGAA CAAACGTATC 
AAGTTGCAGT CGCATTAGAG TTAATTCATA TGGCAACACT TGTTCATGAT GACGTTATTG 
ATAAAAGCGA CAAGCGTCGA GGCAAGTTAA CCATATCAAA GAAATGGGAT CAGACAACTG 
CTATTTTAAC TGGGAATTTT TTATTGGCAT TAGGACTTGA ACACTTAATG GCCGTTAAAG 
ATAATCGTGT ACATCAATTG ATATCTGAAT CTATCGTTGA TGTTTGTAGA GGGGAACTTT 
TCCAATTTCA AGACCAATTT AACAGTCAAC AGACAATTAT TAATTATTTA CGACGTATCA 
ATCGCAAAAC AGCACTGTTA ATTCAAATAT CAACTGAAGT TGGTGCAATT ACTTCTCAAT 
CTGATAAAGA GACTGTACGA AAATTGAAAA TGATTGGTCA TTATATAGGT ATGAGCTTCC 
AAATCATTGA TGATGTATTA GACTTCACAA GTACCGAAAA GAAATTAGGT ' AAGCCGGTCG 
GAAGTGATTT GCTTAATGGT CATATTACGT TACCGATtTT ATTAGAAATG CGTAAAAATC 
CAGACTTO^A ATTGAAAATC GAACAGTTAC GTCGTGATAG TGAACGCAAA GAATTTGAAG 
AATGTATCCA AATCATTAGA AAATCTGACA GCATCGATGA GGCTAAGGCA GTAAGTTCGA 
AGTATTTAAG TAAAGCyTTG AATTTGATTT CyGaGTTACC aGATGGACaT CCGaOAtCAC 
TACyTTTAAG TTTGACGAAA AAAATGQGTT CAAnAAACAC GTAGTATTTA TGnAAAAGTA 
TTGAAAGCGC TTTACCAACC TGTTAATATA TAATAGTAAT ATAC 
(2) INFORMATION FOR SEQ ID NO: 186: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 6876 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

' (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 186: 
AATTTCATCT GCTCGTGCAA AATCTTTGTT TTTCCTTGCT TCATTACGCT CTTCGATTAA 
TTTTTCAACA TCTTCATCCA ATAATTCATC TGCATTTTTA GATTTTAACG GTACACCTAA 
AACATCGCTG AAAATTTGAT AAACTGCTTT AAATTTATCA ATTACTTCTG TTGATGTTGT 
GTTCTCTAGT ACATATTTAT TCGCAAGTkT TGCTAAATCA TACCAAGCTG TAATTGCATT 
AGCTGTATTA AAATCATCAT TCATAACTGT TTCAAAACGA TTTAAAATCG CATCAATTTG 
ATCAATATAT . GTCTGTTGAT TTTCAATATT AGTAGCAATT TGTGCGCGCT CTTCAATTAA 
TTGATAACTA TTGCGAATAC GCTCTAGTcC aCTACGTGCT GATTCTACCA ATTCTAGATT 
ATAGTTAATT GGGCTTCTAT AATGTACGCT AATCATAAAG AATCTTAGTA CATCTGGATC 
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ATTATCAATA TTAATGAAAC CATTATGCAT CCAATAATTA GCAAATGGCG CATGATTATG 
TGCTTCTGAT TGTGCTATTT CATTTTCATG ATGTGGAAAT TGTAAATCTG AACCACCCGC 
ATGTATATCA ATTGTAGGTC CTAGCTCATG AAATGCCATT ACAGAACATT CTATATGCCA 
TCCTGGTCTA CCTTCACCAA ATGGGCTATC CCAACTAATC TCGCCAGGTt CGCTTTTTTC 
CACAATGTAA AATCAAGTGC ATCTTCTTTA TGCTCTCCTG CATCTATACG AGCACCCACT 
TTTAAGTCAT CTATGGATTG ATGACTTAAT TTACCATAAC CTTCAAATTT ACGTGTTCTA 
AAGTAAACAT CGCCACCACT TTCATATGCA TAACCTTGAT CCACCAAATC TTTAATAAAT 
TGAATAATGT CATCCATATG GTCCATTACC CrrGGATTTG AAGTCGCTTT TCTAACATTT 
AACGCACCAA CATCTTCATG AAAAGCAGCG ATATATTTTT CTGCAATTTC GGGAACAGAC 
TGATTTAATT CTTGAGAACG TTTAATTAAT TTATCATCTA CGTCTGTAAA ATTTGATACA 
TATTCTACAT TATATCCTTG GTATTCAAAG TAACGTCTCA CTACGTCATA ATTAATTGCw 
GGTCTTGCGT TACCAATATG AATGTAGTTA TATACAGTAG GACCACATAC ATACATTTTT 
ACTTTCCCTG GTTCTATAGG CTTGAACACT TCTTTTTGAC GTGTAAGCGT ATTATATAAT 
GTAATCATCT TGAATCTCTC CATTCCTAGT CTTTTCAAGT TCTCGTTCTA AATGCTTAAT 
TTGTTCATAA ATTGGATCAG GTAGATGGCG ATGATCAAAT GTTTTTCCAA CTCGAACACC 
ATCTTGCTTA ACAATATGTC CTGGTATACC AACAACCGTT GAATAACTTG GAACTGATTG 
TAAAACAACT GAATTTGCAC CAATATTTAC ATTTGAATTT ATTTTAATAT TTCCTAAAAC 
TTTCGCACCG GCTGCTATTA AAACATTGTC TCCTATATCT GGGTGTCTTT TCCCTCTTTC 
TTTCCCTGTC CCACCAAGTG TCACGCCTTG ATAGATTGTC ACATTATCAC CAATTGTACA 
TGTTTCTCCT ATTACAACGC CCATACCATG ATCTATAAAT AGACGCTTTC CAATTTTAGC 
ACCTCGATGG ATTTCTATAC CTGTGAAAAA TCTTGAAATT TGAGATATCG CGCGTGCTGC 
AACATATTTT TTTTGGTTGT ATAACTTATG TGCAATCAAA TGACTCCAAA CTGCATGTAA 
ACCTGCATAC GTTGTAATGA CTTCTAATGT TGAACGTGCC GCTGGATCCT GCTCAAATAC 
CATTTTTATA TCGTCTCTCA TTCTTTTTAA CAAGATCATT TCCTCCTCAA TGATTGAACT 
ACGTAAATAC ATAATTGAAG TACCTGCGAA ATTAAATATC AAAAAAGCAC CACTAACATA 
CAAATTGTAT TGTTAGAGGC GCTTCCGCAC GGTTCCACTC TGAATTTAGC GAATAACATT 
AATAATATTG CGGGCGCTTC CAAATTATCA AGGAAACTAA GTCAACTTAA TGCTCATCAC 
TCTCATTATA TATTTAATTC ATTTTACGAA GGTGCATTCA TTAATTTCTA CGTTGTACTC 
ACAGCAACCG TACACTCTCT GCATCGTATA AATTTAATTA CTAATCCTTC GTTTTATATA 



600 
660 
720 
780 
840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1300 
1360 
1920 
1990 
2040 
2100 
2160 
2220 
2280 
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ATAAAATTCA AGTATATACT ACCTTGATCT TGTCTATTTC ATTACTTATA 


TTGTTTTAAA 


2400 




CGGTTTAGCA 


CTTTTTCTTT 


ACCAAGTACT 


TCAATTGTAT 


TTGGTAATTC 


AGGACCATGC 


2450 


5 


ATTTGGCCTG 


TTACAGCAAC 


ACGAATAGGC 


ATAAATAATT 


GCTTGCCTTT 


TATTCCTGTT 


2520 




TCTTTTTGAA 


CTTCTTTAAT 


TGTCTTTTTA ATTTCAGCCG 


CTTCAAATGG 


TTCAAGTGCT 


2580 


It) 


TCTAATTTAC 


TGAATAAGTG 


CGTCATTAAC 


TCTGGTACTT 


GCTCTCCATT 


AATCACTTGT 


2640 


TGTTCTTCTT 


CACCAAGAGC 


TGGCATTTCT 


TTAAAGAACA 


TTTCTGATAA 


AGGTACAATT 


2700 




TCACCGGCAT AACTCATTTC TTTTTGATAA AGCGCAATTA ATTTGCGTCC CCAAGATAAA 


2760 


15 


TCCTCTTCTG ACGGCACCTC AGGAATCAAA TTTGCTTTAA 


TTAAATGAGG 
TATTAACCCA 


TAATGCTAAT 


2820 
2880 




TGGAATACTG 


TTTCAGTATC 


TTTTTGTTTC 


ATATATTGGT 


TGCTAArriT 




TGCTTATCGA AAAATGCTGG 


TGATTTTGAC 


AAACGCTTTT 


CATCAAAGAT 


TTTGATAAAT 


2940 


20 


TCTTCTTTAG 


AAAAGATTTC 


TTCTTCACCT 


TCAGGAGACC 


AACCTAATAA 


CGCAATAAAA 


3000 




TTAAATAACG 


CTTCAGGTAA 


ATAACCTAAG 


TCACGATATT 


GCTCAATAAA 


TTGTAAAATt 


3060 




TGCCCATCAC 


GTTTACTTAA 


CTTTTTACGT 


TCTTCATTAA 


CAATTAATGA 


CATATGACCA 


3120 


25 


AAACGAGGTG 


GCTCCCAGCC 


AAATGCTTCA 


TAAATCATAA 


TTTGTTTAGG 


CGTGTTTGAA 


3180 




ATATGATCAT 


CACCACGAAT 


TACATCTGAA 


ATTTGCATGT 


AATGATCATC 


TATAGCTACT 


3240 


in 


GCAAAATTG7 


ACGTTGGAAT 


GCCATCTTTT 


TTTACGATAA 


CCCAGTCACC 


AATACCATTT 


3300 


GAATCAAATG 


AAATATTTCC 


TTTTACCATA 


TCATCAAATG 


AATACGTTTG 


GTTTTGAGGT 


3360 




ACTCGGAAAC 


GAATTGATGG 


TTGGCGTCCT 


TCTGCTTCAA ATTGTTGACG 


TTGTTCTTCA 


3420 


35 


GTCAAATGCG 


CATGTTGACC ACCATAGCGA GGCATTTCAC CACGAGCGAT 


TTGCGCTTCA 


3430 




CGTTCAGCTT 


CTAATTCTTC 


TTCTGTCATA 


TAGCATTTAT 


ATGCTTTATC 


TTCTGCTAGT 


3540 




AACTGATCTA 

• 


TTAATGGTTG 


GTAGATATGT 


TGACGTTCAG 


ATTGACGATA 


TGGTCCGTAG 


3600 


40 


CCATTGTCTT 


TATCTACAGA 


CTCATCCCAA 


XCTAATCCTA ACCATTTAAG 


ATTATCAAAT 


3660 




TGTGATGTTT 


CTCCATCTTC 


TAAATTACGT 


TTTTTATCAG 


TATCTTCAAT 


TCGAATCACA 


3720 




AAATCTCCGT 


TGTAATGTTT 


AGCATACAAG 


TAATTGAATA 


ATGCTGTTCT 


TGCATTACCA 


3780 


4$ 


ATATGAAGAT 


ACCCAGTTGG 


ACTTGGTGCA 


TATCTTACTC 


TTATACGATC 


GCTCATTTTT 


3840 




TTCACTCCTA AATTAAATAT 


CAGATTTTCA 


AGTTAGTTCA 


TATAAATTGT 


TCATTTGCTA 


3900 


SO 


TCTTCGACCG 


TCATAACAAA 


TGTCTAACrC 


GTCTTATTGT 


TAAAACGAAA 


CAATGCTTTT 


3960 


TAACATGACC 


TTAAAATAAT 


TTCATTGTTT 


AATCATAACA 


TAATTCCCTG 


GGTAATATGC 


4020 




TTAAATTTTA AATAGAAAGC 


TGTTGTTTTT 


TCAACACTTT 


AAAAAAGCTA 


TCCCTAAGAA 


4080 
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TTAAACTTCA AATTAACTAT TCAAATACGT TAAAATTGAT TCTAATTTTG TATGTCTTGA 4200 

TTGCTATAAG AATAACTTTA TTAATATCTA AAATTTAACA CTTAATGAAC TTGTTTCAAT 4260 

GATATATTAG CACTATTTGT ATTTTTTGAT AACTAATATG TTTTGCATTT ATTTATAGTT 4320 

ATACTTCAAA TTACAAACTt CGCCATTTCA TATACCTTTT AATATCTATT TTGTTTTCGT 43 80 

CAACTACAGT TTTTATAATG ATACTGTATC TTCGATTTTT TTAGCAAAAA CAATTCTTCC 4440 

TGAAGATGTT TGCAATAAGC TGACTACTTC TAAATTGACA TGACTGCCAA TAAGATTTTT 4500 

AGCATTATCA ACAACTACCA TCGTACCATC ATCTAGATAT CCTACTGCCT GACCAGGCtC 4560 

CTTACCCATT TTTGTCAGTA AAATATGCAG TTGATCACCT TGATGTACAT TAGGTTTGAT 4620 

TGCTTCTGAT AAATCATTAA CATTTAATGC TTTGATACCA TGTACATGAC AAACTttATT • 4630 

TAGGTTGAAA TCTGTCGTTA TAATACTTGC ATGATATTGT TTTGCTAATT TTAATAACAT 4740 

20 CGTATCAATA TCACTATGTG TTTTAGTTGG ATGTATAACC TTTGTAGGAT AGTCTAAATC 4800 

ATACAATTCA TTTAAAATAT CTAAGCCTCT TTTACCCTTT TCaCGTTTAA CACTGTCATT 4860 

TGAATCTGCA ACAATTTGTA ATTCATTAAT AACACCTTGT GGAATTAAAA TATTGCCATC 4920 

GATAAAACCX5 CAACGAATGA CTTCTAAAAT ACGACCATCA ATAATTGCGC TTGTGTCGAT 4930 

AATTTTTGGC GTAgcaCTTT TaGTATGTTG TGACATGGAA CGCGCTATAT TCTCAOGTAA 5040 

AAACATTAAC ATTTCATCTC GTTTTTTAAG GCCAAATTGG AAACCGAAAT AACATAGTAA 5100 

TATCGTAATT ATGACAGGAA TGAAATGATT AAAAATAGAG TTGCCAATTG ATTCTAATAT 5160 

AAACGACACC ATAACAGAAA TAAGTAATCC GATTATTAAA CCTATTGTTG CGAATAGTAT 5220 

TTCAACAGCA CTTCTACGCA TAATAAAATG TTCTAAACCT TTTATAGCGT TAGTAACTCG 5280 

TCTAATAAAT ACACCAAAAA TTAAGAACAT AAAAATACTA CCGATAATGC CATCTACATA 5340 

GTGATTTTTT AAAAAGCTGG AGTTTTGTAA TCCAAGATCA TTTGCAATTT CAGGAATAAT 5400 

40 AATTATTCCT AATGCGCTCC CAATAATTAA GTAAATAATA ATAACCATTA GTTTAACGAT 54 60 

ATTCACACAA TGTCCTCCTT TCTTGATGTT TTATGAATGA AGAGCAAATG ACAATACTTC 5520 

ATGTACAGTA GTTACACCTA TTACTTGTAT ACCTTCAGGA TATGTCCATC CGCCTATATT 5580 

ATTTTTAGGA ATAATTACAC GTTTGAAACC TAGTTTTGCA GCCTCTTGCA CGCXSTTGTTC 5640 

TATCCGAGAT ACACGACGTA CCTCACCCGT TAAACCAACT TCTCCAATAT AGCAATCTAA 5700 

TCCGTCGACA GCTTTATCTT TAAAGCTAGA TGCAGTTGCT ACAATTACAC TTAAATCAAC 5760 

TGCTGGCTCC GTTAACTTTA CACCGCCAGC TAC7TTGATA TAAGCATCTT GTTGTTGTAA 5820 

TAGATAATTT TCTTTCTTTT CCAAAACAGC CATCAACAAA CTTAATCGAT TATGATCAAT 5880 
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TATTAAAAGT GGTCTGGTTC CCTCCATGGT TGCAACAATT GTTGAACCTG GAACATTTGT 6000 

TGAACGTTCT TCTAAAAACA TTTCAGATGG ATTATTTACA CCTTTTAATC CACTTTGCTT 6060 

CATTTCGAAG ATTCcCATTT CATTCGTTGA ACCAAAACGG TTTTTAACAG CTCGCAAAAT 6120 

TCGATATGCG TGGTGTTCAT CGCCTTCAAA ATAAAGCACA GTATCaACCA TGTGTTCTAG 6X80 

CAATCTTGGG cCCAGCAATT TGACCTTCTT TCGTTACATG ACCCACTATA AAAGTTGCaA 6240 

TGTTCATTTG TTTAGCAATA TTCATTAAAC TTTGTGTACT TTCACGAACT TCTGAAACAG 6300 

AACCTGGCGC AGAGCTGATT TCAGGATGAT ATATTGTTTG AATCGAATCC ACTACTAATA 6360 

AATCAGGTTG TTCTTCTTTT ACTGTTTGAT AAATAACTTC AAGATCTGTT TCAGCTAATA 6420 

CTTGCAATTC ACTTGAATCT TCATCTAATC GCTCTGCACG TAATTTAGTC TGACTAAGCG 64 30 

ATTCTTCTCC AGTAATATAT AGTACTTTTT TCTTTTGAGA TAACGATGCA CAAATTTGTA 6540 

20 AAAGTAACGT TGACTTACCA ATACCTGGAT CCCCACCAAT AAGTACTAAC GATCCGCTCA 6600 

CAATACCTCC ACCTAATACA CGGTTGAATT CTGCTGAATC TGTTAACACT CTCGGCGriG 6660 

TTTCATGTTT AATACTATTT AATTTTTGTA CTTTACCTGC TAATTCCTTG GTTTTAACTC 6720 

CATGTTTAGG ATTGGCTGCT TTTTCAACAA TTTCCTCCAT ITGATTCCAA GCGCCACAAT 6780 

TAGGACATTT CCCCATCCAT TTAGGAGATT GATAACCACA AGCCATACAT TCAAAAATCA 6840 

CTTTTTTCTT GGCCArAATT GCAcCTCCAC TTTCTT 6876 
(2) INFORMATION FOR SEQ ID NO: 187: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1193 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



25 



30 



45 



40 ■ (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 187: 

CAACTCAAAC AGCAGAACAA CGTCGTGAGT TGATTAATGG TGTATTTACT GACATTAATC 60 

CCATACATTA AAAATATGAT GTACGTGTTA GCAGATAATA GACATATCTC ATTAATAGCT 120 

GACGTATTCA AGGCGTTCCA AAGCTTATAT AACGGACACT ACAATCAAGA TTTTGCAACA 130 

ATTGAGTCAA CATATGAATT GAGTCAAGAA GAGTTAGATA AGATTGTCAA ACTAGTAACT 240 

CAACAAACGA AGTTATCTAA AGTTATTGTA GATACAAAAA TTAATCCAGA TTTAATTGGT 300 

GGATTTAGAG TTAAAGTCGG CACAACTGTA TTAGATGGTA GTGTTAGAAA TGATCTTGTC 360 

CAATTACAAA GAAAATTTAG AAGAGTTAAT TAATTATAAA GAGGAGTGAC ATAGATGGCC 420 
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ATGTCCGTAA 


CTGATGTAGG 


TACTGTATTA 


CAAATTGGTG 


ATGGTATTGC 


ATTAATTCAC 


540 


GGATTAAATG 


ACGTTATGGC 


TGGTGAGCTA 


GTAGAATTCC 


ATAACGGCGT 


ACTTGGTTTA 


600 


GCCCAAAACC 


TTGAAGAGTC 


AAACGTGGGT 


GTGGTTATTT 


TAGGACCATA 


CACAGGTATT 


660 


ACTGAAGGTG 


ACGAAGTTAA 


ACGTACTGGT 


CGTATCATGG AAGTACCAGT AGGTGAAGAA 


720 


CTAATCGGAA 


GAGTTGTTAA 


TCCATTAGGA 


CAACCTATTG 


ATGGACAAGG 


ACCGATTAAC 


780 


ACAACTAAAA 


CACGTCCaGT 


AGAGAAAAAA 


GCTACTGGTG TAATGGATCg TAAATCAGTA 


340 


GATGAGCCAT 


TACAAACAGG 


TATCaAAGCA 


ATTGATGCTT 


TAGTACCAAT 


TGGTAGAGGT 


900 


CAACGTGAGT 


TAATCATCGG 


TGACCGTCAA 


ACAGGTAAAA 


CAACAATTGC 


AATTGACACA 


960 


ATTTTGAACC 


AAAAAGATCA 


AGGTACGATT 


TGTATCTATG 


TTGCTATTGG 


TCAAAAAGAT 


1020 


TCAACAGTAA 


GAGCAAATGT 


TGAAAAGTTA 


AGACAAGCAG 


GCGcrrrAGA 


CTACACTATT 


lOBO 


GTTGTAGCAG 


CATCAGCTTC 


TGAACCTTCT 


CCATTATTAT 


ATATTGCACC 


ATATTCAGGT 


1140 


GTAACAATGG 


GTGAAGAATT 


CATGTTTAAC 


GGTAAACATG 


TTTTAATCGT 


TTA 


1193 



(2) INFORMATION FOR SEQ ID NO: 188: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 5549 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: IBS: 



AACATCTAGT 


ACGATTATTA 


AAGTGACAGA 


60 


TATAAAGTTT 


GAAGAAATAA 


AAGAAAGACT 


120 


TACTTGGGAT 


TTATTTATAC 


CGAATTTTTT 


IBO 


TAATTTACTT 


TTTGATTCAA 


GGTTATTCCA 


240 


ATGGCATTGC 


AGCATTiTTA 


TTCTCTCTAT 


300 


TAAAAGATTC 


TAATAAATTA 


GTTGTTAGTG 


360 


TATTATATCA 


AAATCAATAT 


TTAArriTAG 


420 


ACTCAATGAT 


GGCGGGTGTT 


GATACCGCAA 


480 


ACGTACAAAA 


TAAGTCAAAT 


AGCTATATGT 


540 


GTAGTTATCT 


TTATGGAATA 


AATATTAAAT 


600 


TTCTAACAAT 


TATAATTATT 


CGATGCACAT 


660 
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TACCAGAAGA GAAGTTTTGG ATATTGCATT ATTCTTTTTT 


AAGAGCGTTA ATATTAGGAT 


780 




TTTTTATAGG 


ATTTATTCCA ATTAATATAT ATAATGATTT AAAACTGAAT 


AATTTACAAT 


840 


5 


TTATTTCAGT 


ATTAACTTGT 


TACACAGTTA TGGGTTTTGT 


A7CTTCACGT 


TATTTAACTA 


900 




AATACTTGAA 


TTATAAGTTT 


GTGTCAGAAA TTTGTTTAGT 


AATATTTTTA 


ATAATATATA 


9S0 


10 


CATATCAAAG TTTCATAGCA GTTACTATTT CTATGATATT 


TTTAGGTATT 


TCTTCAGGGT 


1020 


TAACTCGTCC 


ACAAACTATA 


AATAAACTTT CTAGCAGTAG 


TAACTTAAGA 


GTGATGCTTA 


1080 




ATTATGCAGA 


AACGTTATAT 


TTTATTTTTA ATATCGCATT 


TTTACTTATG 


GGTGGTTACT 


1140 


IS 


TATATACAAT 


AGGAACTATT 


CAATACTTAA TATTATTTAT 


TTCGTTATTA 


ATTTTTATAT 


1200 




ATTTAATAAT AATATTTyAT TTTACAAGGA GAGAGCAACA 


TGAAAATAAA 


AACTGAATTT 


1260 




AAAGGGAACA 


ATATACCA1A 


TGAATACGCA GCAGGTGCAG 


ATGTGAGTGA 


TTCTATTAAC 


1320 


20 


GGGAATCCAA 


TTAAGTCATT 


TCCATTTGAA GTAATTGAAT TACCGGAAGG gACTAAATAT 


13B0 




CTTGCTTGGT 


CTTTAATTGA 


CTATGATGCA ATTCCTGTAT GTGGCTTTGC 


TTGGATTCAT 


1440 




TGGAGTGTAG 


CTAATGTAAG 


TGTTAGTGGC AATTCAATTT 


CTATAAAAGC 


AGATTTATCA 


1500 


25 


AGAACAAAGG 


GCGACTATGT 


ACAAGGTAAA AATAGCTTTA CTAGTGGGTT GTTGGCTGAA 


1560 




GATTTTTCAG 


AAATAGAAAA 


TCACTATGTA GGACCTACAC 


CACCTGATCA 


AGATCATCAA 


1620 


m 
iSv 


TATGAATTAA 


CAGTTTATGC 


GTTAGATCAT TCTTTAAATT 


TGAAGAATGG 


GTTCTACTTG 


1680 


AATGAATTTT 


TAAAAGAAGT 


AAATCAACAT AAAATTGATC 


AAACAAGTAT 


TAACCTTATA 


1740 




GGAAGAAAAA 


TTTAATACTA 


AATATCTCAT CAATATAAAA 


TTGTTCAATT 


AAAAGTACAA 


1800 


35 


AGAAACAAAG GTTTTAATTT ATATATTAGG TACGGCGTTC 


GCTATAATGC 


AAAGAAGTAA 


1860 




TTAAATTTAA 


GAAATGTAAA 


CTTAGTTATT GTAATGTGAA 


TTTATTTGAA 


AAAATAGAAA 


1320 


40 


GTATTAACAA TTATAGCm' 


TACATTAATT AAAATTTATT 


TTTAAAAACA 


AGTAAACAAT 
GTAAGATACT 


1980 
2040 


TTACATACTT 


ATAATTTTTG 


AAAATTTTCA ATTTGTGTTA 


TATTGATTTT 




TTAACTCACA 


AAGGAGAGAG 


AGTATATGAA ATTAAAATCA 


TTTATAACTG 


TAACTTTGGC 


2100 




ACTGGGCATG 


ATCGCAACGA 


CTGGCGCTAC TGTGGCAGGT 


AATGAGGTAT 


CTGCAGCAGA 


2160 


45 


AAAGGACAAA 


CTACCGGCAA 


CTCAAAAAGC TAAAGAAATG 


CAAAATGTTC 


CATATACAAT 


2220 




TGCAGTAGAT 


GGCATTATGG 


CTTTCAATCA ATCTTACTTA AATTTACCAA AAGATAGCCA 


2280 


SO 


ATTATCATAT 


TTAGATiTAG 


GAAATAAAGT TAAAGCTTTG 


TTATATGATG 


AACGCGGTGT 


2340 


AACACCTGAG 


AAGATTCGAA 


ATGCAAAATC TGCCGTTTAC 


ACGATTACTT 


GGAAAGATGG 


2400 




TAGTAAAAAA 


GAAGTGGATC 


TTAAGAAAGA TAGCTACACA GCAAACTTGT 


TTGATTCAAA 


2460 
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CAACATGAAG CATTTAATTT TACAGTGATG ATTATAAAAT AATTGCCTTG ATACAAAGAT 2S80 

TACTCGTAAA TGACATCTTT GTATTAAGGC TTTTTCTAAA TTTAAAAGTG ATGGGTTAGA 2640 

GGTCATTGAG CTTTAAAATA TTCAAAATAC AAAACATTAA TGGCCAAAAA TAAAAGCCGC 2700 

CTTTATCTGG GCAGCTTCAA TAATAAGAAA GACATATTTC ATTTTATACT AAATAGTTAT 2750 

TGTGATGAAT CTTTCGGCGG TTTAATTACT GCAGCAAAAA TTGCTGTGAA AATCGTGAAC 2320 

AATACTGCCA TGATAATTGG ATTCACTACA TTTAAGCTGT CTCCACCTAC TAGGCTATTA 2380 

AGTACAAAGT TAACCATTTG CATTAATAAT AATGCCCAAA AGAATGTTAC GAGGTGTTTC 2940 

ATGTCATTCT ACCTCCACTT TAATTATATA TATTTTATTT TAAGTGAAAG TTAGAAATTT 3000 

GTATAGTAAC ATCTCATATA TTTTGACCAT ATTATACAGT TTAAATAAAT GATTTTATCT 3060 

GAATGGCTA7 TCTAAATTAA GCGCATTAAA ACCAATTTCA TACTGAAATT TGACGATAAT 3120 

20 AAAGCATTAA AATTTTATTA ACTAGTCAAT ATTCCTACCT CTGACTTGAG TTTAAAAAGT 3180 

AATCTATGTT AAATTAATAC CTGGTATTAA AAATTTTATT AAGAAGGTGT TCAACTATGA 3240 

ACGTGGGTAT TAAAGGTTTT GGTGCATATG CGCCAGAAAA GATTATTGAC AATGCCTATT 3300 

TTGAGCAATT TTTAGATACA TCTGATGAAT GGATTTCTAA GATGACTGGA ATTAAAGAAA 3360 

GACATTGGGC AGATGATGAT CAAGATACTT CAGATTTAGC ATATGAAGCA AGTTTAAAAG 3420 

CAATCGCTGA CGCTGGTATT CAGCCCGAAG ATA7AGATAT GATAATTGTT GCCACAGCAa 3480 

CTGGaGATAT GCCATTTCCA ACTGTCGCAA ATATGTTGCA AGAACGTTTA GGGACGGGCA 3540 

AAGTTGCCTC TATGGATCAA CTTGCAGCAT GTTCTGGATT TATGTATTCA ATGATTACAG 3600 

CTAAACAATA TGTTCAATCT GGAGATTATC ATAACATTTT AGTTGTCGGT GCAGATAAAT 3660 

TATCTAAAAT AACAGATTTA ACTGACCGTT CTACTGCAGT TCTATTTGGA GATGGTGCAG 3720 

GTCSCGGTTAT CATCGGTGAA GTTTCAGATG GCAGAGGTAT TATAAGTTAT GAAATGGGTT 3780 

40 CTGATGGCAC AGGTGGTAAA CATTTATATT TAGATAAAGA TACTGGTAAA CTGAAAATGA 3840 

ATGGTCGAGA AGTATTTAAA TTTGCTGTTA GAATTATGGG TGATGCATCA ACACGTGTAG 3900 

TTGAAAAAGC GAATTTAACA TCAGATGATA TAGATTTATT TATTCCTCAT CAAGCTAATA 3960 

TTAGAATTAT GGAATCAGCT AGAGAACGCT TAGGTATTTC AAAAGACAAA ATGAGTGTTT 4020 

CTGTAAATAA ATATGGAAAT ACTTCAGCTG CGTCAATACC TTTAAGTATC GATCAAGAAT 4080 

TAAAAAATGG TAAAATCAAA GATGATGATA CAATTGTTCT TGTCGGATTC GGTGGCGGCC 4140 

TAACTTGGGG CGCAATGACA ATAAAATGGG GAAAATAGGA GGATAACGAA TGAGTCAAAA 4200 

TAAAAGAGTA GTTATTACAG GTATGGGAGC CCTTTCTCCA ATCGGTAATG ATGTCAAAAC 4260 
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TGAACCTTAT AGCGTTCACT TAGCAGGAGA ACTTAAAAAC TTTAATATTG AAGATCATAT 4380 

CGACAAAAAA GAAGCGCGTC GTATGGATAG ATTTACTCAA TATGCAATTG TAGCAGCTAG 4440 

AGAGGCTGTT AAAGATGCGC AATTAGATAT CAATGAAAAT ACTGCAGATC GAATCGGTGT 4500 

ATGGATTGGT TCTGGTATCG GTGGTATGGA AACATTTGAA ATTGCACATA AACAATTAAT 4560 

GGATAAAGGC CCAAGACGTG TGAGTCCATT TTTCGTACCA ATGTTAATTC CTGATATGGC 4620 

AACTGGGCAA GTATCAATTG ACTTAGGTGC AAAAGGACCA AATGGTGCAA CAGTTACAGC 4680 

ATGTGCAACA GGTACAAATT CAATCGGAGA AGCATTTAAA ATTGTGCAAC GCGGTGATGC 4740 

AGATGCAATG ATTACTGGTG GTACAGAAGC ACCAATTACT CATATGGCAA TTGCTGGTTT 4800 

CAGTGCAAGT CGAGCGCTTT CTACAAATGA TGACATTGAA ACAGCATGTC GTCCATTCCA 4 860 

AGAAGGTAGA GATGGTTTTG TTATOGGTOA AGGTGCTGGT ATTTTAGTAA TTGAATCTTT 4920 

AGAATCAGCA CAAGCTCGAG GTGCCAATAT TTATGCTGAG ATAGTTGGCT ATGGTACTAC 4980 

AGGTGATGCT TATCATATTA CAGCGCCAGC TCCAGAAGGT GAAGGTGGTT CTAGAGCAAT 5040 

GCAAGCAGCT ATGGATGATG CTGGTATTGA ACCTAAAGAT GTACAATACT TAAATGCCCA 5100 

TGGTACAAGT ACTCCTGTTG GTGACTTAAA TGAAGTTAAA GCTATTAAAA ATACATTTGG 5160 

TGAAGCAGCT AAACACTTAA AAGTTAGCTC AACAAAATCA ATGACTGGTC ACTTACTTGG 5220 

TGCAACAGGT GGAATTGAAG CAATCTTCTC AGCGCTTTCA ATTAAAGACT CTAAAGTCGC 5280 

ACCGACAATT CATGCGGTAA CACCAGATCC AGAATGTGAT TTGGATATTG TTCCAAATGA 5340 

AGCGCAAGAC CTTGATATTA CTTATGCAAT GAGTAATAGC TTAGGATTCG GTGGACATAA 5400 

CGCAGTATTA GTATTCAAGA AATTTGAAGC ATAACTATAA nAATCTTCAG TAACGTTGTT 5460 

TTAGTTACTG AAGATTTTTT CaGTTTCTTT ATACTAAGAT GAGCGACAcA CAATCGTCAT 5520 

AATiWlATAT GAATATTTAT TAATAATAA 5549 

• * 

(2) INFOEIMATION FOR SEQ ID NO: 189: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4832 base pairs 
(3) TYPE: nucleic acid 
45 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



25 



30 



35 



50 



(xi) SEQUENCE DESCRIPTION; SEQ ID NO: 189: 
AGATTATAGT AAGATTGATA GTTTGGCGAC TGaAGCgCGa GaAAAATTAT CAGaAGTAAA 60 
mCCTTTAAAT ATTGCACAAG CTTCTAGAAT ATCAGGGGTA AATCCAGCAG ACATATCTAT 120 
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TGGTTAGCAG AACAATTAAA AGAACATAAT 
TTTCAAACAT ATTATCGTTT ACTTGTTGAA 

5 

ACAGATGAAC ACGATGTATA TTTGAAACAT 
TTTGATTTTA ATCAGCCTAT AAGTATATGT 
ATTCCGTTAA AAATAATGTT TCCGCAGTTA 

10 

CGTATTCAAT TTTTAAACCA TTTAGCGTCA 
CACGATAGAG CAGAAACATT TGGTAAGGGT 
15 GCAAGAGCAg TAGCTAGATT ATCCGTGTTA 
GGTGGACAGT TTGTTGCATT AAAATCTTCA 
TTTGCAATTA GTGTGTTAGG TGGTAATGTT 
GATGCTGGAG AGCGCCAGAT GTTCATTATT 
CCAAGAAAAC CAGGGACGCC TAATAAGACT 
TACAACTAAC ATAAAAGGAG CGAATGGATA 

25 

TTGAAAAACA AAGATGACAT CATTGGACAT 
TCCATTCAAA TTGAACGTAT CGTTCCCAAC 
AATAAAATTA AAGAACTTGC TGAATCAATA 

30 

GTAAGACCGA TTGAAGAAGA TATGTTTGAA 
ATACAATCAC TAAATTTACC TCAAGCAGAC 
35 ACGGCTGTTG TTGCATTAAT TGAGAATATT 
GCGGAAGCCT ATAAGAAATT ATTGGAAATT 
agtt5aggta AAAGTCAAAG CTTTATTGCA 
AAAGTACTAC TTCGCTTAAG AGAAGGTAAA 
TCATTGTCTG ATAGCGAACA AGAAGCGTTG 
GTGAAcAGAc TGAAGATAGA GTACGCCAAA 

45 

ACCTTCGCTT TGCACAAGAT GTCACTCAAG 
CGATTCAACA AACAGGATTA CATGTTGAGC 
AAATAAAAAT TCGAATATAT AAACGTTaGT 

SO 

CATAAAAGAC AAAGCTAAGA TCATAACAGC 
ATAAAAATTT ATATTTATAT GTTGATCAGG 

55 



ATTCAATTAA 


CTGAGACTCA 


AAAACAACAG 


240 


TGGAATGAAA AGATGAATTT GACAAGTATT 


300 


'rrn'ATGATT 


CCATTGCACC 


TAGTTTTTAT 


360 


GATGTAGGCG 


CTGGAGCTGG 


TTTTCCAAGT 


420 


AAAGTGACGA 


TTGTTGATTC 


ATTAAATAAG 


480 


GAATTACAAT 


TACAGGATGT 


CAGCTTTATA 


540 


GTCTACAGGG 


AGTCTTATGA 


TGTTGTTACT 


600 


AGTGAATTGT 


GTTTACCGCT 


AGTTAAAAAA 


660 


AAAGGTGAAG 


AAGAATTAGA 


AGAAGCAAAA 


720 


ACAGAAACAC 


ATACCTTTGA ATTGCCAGAA 


780 


GATAAAAAAA GACAGACGCC 


GAAAAAGTAT 


840 


CCTTTACTTG 


AAAAfVTAATG 


CATAATCCTT 


900 


ATGAAAAAAC 


CTTTTTCAAA 


ATTATTTGGT 


960 


ATTGAAGAAG 


ATCGCAATAG 


TAATGTTGAA 


1020 


CGTTATCAAC 


CAAGACAGGT 


GTTTGAACCA 


1030 


CATGAACATG 


GTTTACTACA 


ACCTATTGTT 


1140 


ATTATTGCTG 


GAGAGCGCCG 


ATTTAGAGCA 


1200 


GTTATTATTC 


GTGATATGGA 


TGATGAAGAG 


1260 


CAAAGAGAAA 


ATTTGTCTGT 


TGTTGAAGAA 


1320 


GGTGATACAA 


CGCAAAGTGA 


ATTGGCAAAA 


1380 


AATAAGTTGC 


GTTTATTGAA 


GTTGGCGCCG 


1440 


ATTACTGAAC GTCATGCGAG AgcGGtATTA 


1500 


ATTGAGCAAG 


TCATTGCACA 


AAAGCTAAAT 


1560 


AAACGGGGCC 


CGAAAAAGTC 


AAAGCACAAA 


1620 


CACGAGATGA GGTAGGCAAA AGTATCCAAG 


1680 


ATAAAGACAA 


AGATCATGAA 


GATTATTATG 


1740 


AGTAGGATGT 


CGTATACATG 


ATGACTAACA 


1800 


TTTGTCTTTT 


TTTTTTGTTT 


TACGTGAAAC 


1860 


CTGGTACATA 


AATCAATGTT 


CTATGCTCTA 


1920 
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TTCTAGTCAA CCTTGCTGGG GTGGGACGAC GAAATAAATT TTGCGAAAAT ATCATTTCTG 2040 

TCCCACTCCC TAATTTGAGC TGGATATACT TTCATTTGAA CCCTTTATTG CTAGTTTATG 2 LOO 

AAAGTATCAT GAAAGCTTTA TGAACATCGC TTGAGTTGCC TTTACAGTAG AAAATTTAAG 2160 

TTTTACACTT TGTGTGAATG ATACGTTTTG TATTGAATTA ATTATAGAAA GGTACGTTGA 2220 

AGATGTTTTC AATTGGAAGT GCAATTCTTC ATTTTGTCAT TGGTGGTATC GCTGTTGCAT 2280 

TAGCTTCAAT TATTGCTGAT AAGGTAGGTG GTAAGTTAGG AGGTATTATA GCTACTATGC 2340 

CGGCAGTCTT TCTTGCGGCT ATTATCGCAT TAGCTTTAGA TCATCGTGGT ACGCAATTAG 2400 

TGGAGATGTC GATGAATCTT AGTACTGGAG CAATTGTCGG TATTCTGTCT TGTATATTAA 2460 

CTGTATTTrr GACATCTCTC TACATTAAGC ATAAAGGTTA TCGGAAAGGC GCAATATTCA 2520 

CAGTTGTTTG TTGGTTTGTC ATTTCCCTCG CAATATTCAG TATTAGACAT TTATAGTTTG 2580 

20 GAAAATGCGT GATAATTAGT TGTATTCAGT TATTAAGTAA TAAATTATTG GAGGCAGAAC 2640 

ATCATGAAAT TAACATTAAT GAAATTTTTT GTGGGGGGAT TTGCAGTATT ATTAAGTTAT 2700 

ATTGTATCTG TAACACTACC TTGGAAAGAA TTTGGCGGTA TATTTGCaAC GTTTCCGGCA 2760 

2s GTATTTTTAG TGTCTATGTT TATTACAGGT ATGCAATATG GTGATAAAGT CGCTGTGCAT 2820 

GTAAGTCGTG GCGCAGTGTT TGGTATGACA GGGGTATTAG TTTGTATTTT AGTTACATGG 2880 

ATGATGTTAC ATATGACGCA CATGTGGTTG ATTAGCATTG TTGTTGGTTT CCTAAGCTGG 2940 

TTCATCAGTG CAGTATGTAT TTTTGAAGCG GTAGAATTTA TAGCACAAAA AAGATTAGAA 3000 

AAGCATAGTT GGAAAGCTGG AAAATCGAAT AGTAAATAGT GTGAACGTAA TCTCTTAACT 3060 

AGGACTAACT TTGCAAGCAT TGAATAGCAT GGAAAAGTTG CATCATTAAT AAGTGAAATT 3X20 

CAAGTTGGCA TTGAGAAAAT TACAAGCGCG TAATCATACa GGTCTGTCTT AAGGGAGTCT 3LB0 

TCGiAcCCCG ATGTTGTCGT ATGTCAAAAC ATTTAGTCAA TCATAAAGGT GACTTGATTT 3240 

« 

AACTTTATCT GATAGTCTGA TTGTAATGAT TGTACTAATT GACTGGAGGC GTATGTAATT 3300 

GAATCTGAGT AAACAAATTA AAAAGTATAG GGAACGAGAT GGTTATTCAC AAGAATATCT 3360 

TGCTGAAAAG TTATATGTAT CTAGGCAGAG TATTTCTAAT TGGGAAAATG ACAAAAGCTT 3420 

^5 ACCAGACATA CATAACTTAT TAATGAyGTG TGAATTGTTC AATGTAACTT TAGATGATTT 34 80 

AGTAAAAGGG ACCATTCCAT TTGTACCTGA TATTAAAGCG CAACGAAGTC TTAACTTATG 3540 

GACATATGTG ATGCTTATTT TCATGACATT AGCTGCAATT TTAATGGGAC CTTTAGTTGT 3600 

TTATTGGAAT TGGACTTGGG GTGTAACXK3T GGCAATCATT TTGGGAATAG GTTTTTATGC 3660 

ATCTATGAAA ATAGAAGATT TAAAAAAAGT GCATAAAATG GACAACTACG ATCGAATTGT 3720 
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GACAAATGCG CTTTCTATTA TATCAGTAAT TGGTATACTC AGCCTCATAA TTTTCCTTAG 
TGTGTATTTG GCAAATAAGT TTTTATAAAT CATCGTGGTA TCGTCTCATA TTATTTATAT 
TATCCAAAAT AGCATAAAAA AATACCAACA AGATTTAGAA CCTTGTTGGT AATCAAAGCG 
aTTCATTTAT AATGAGTCGT TTTATGTTGT AAGATTAAAC AGTTTGTACG TTAACTGCTT 
GGTCTCCACG TTGACCTTCA GTGATTTCGA AAGTAACTTT TTGACCTTCT TCTAAAGTTT 
TGTAGCCATC GCTAGCGATA CCTGAGAAAT GTACGAATAC GTCTCCGCCA TTTTCTTGTT 
GGATGAAACC AAAACCTTTT TCTGCrTTAA ACCATTTwAC TGTACCGTTA TTCATATwGA 
AwACCTCCGT gTGCTTTTGC ACTTAATATT TGTAACAAAT TCATAACTAA AAAAGAGGAT 
ATTCTAAACA AATACACTAC AATTTAATTC ACGAGCTTTT. ATTACGTAAG ACCAACTATA 
CGCTCATATT GGCATAATGT ACAGTGTTTT TTGAAAATAA ATTAAAAAAG ATTTTTAAAA 
ACCTTAGAAA CGTTGATTTA AAGGGGTTTA TAAAAATwAw AAAATTGTAG TCTTTTATGG 
TGTTTGCTAG TTTTCAAAGT GACATATCGT TTAAACATGA TGATTTTATA AGCAATCCAT 
AAAAAACAAG CAGCGATAAA CGCTACTTGT TGATATTAAA ATCTGACTTG AAAGGTCATA 
GCAATGTTCT ATACCGATGG AATGTGCTTA CTTGCCTTTT TCTTCACGAC GTTTTAAATA 
ATAAGAGCCA CCTAATAAAC CAGCTGGAAT GCCTATCATT GGTGTTGTGA ATGAGCTTAA 
TACAATAACA AGTATTGTTA AAGCAATGAC GTTATACCAA GTTACAGTCA AATTTTTCAA 
ATCCTCATAT GATTGTTTTA CTAATTCTCT AAATTTCATG ATTCAATCTC TCCTTTTTTA 
TAAATCTTTA GATTGTCAAA TTAAGCTGGA CA 
(2) INFORMATION FOR SEQ ID NO: 190: 
(i) SEQUENCE CHARACTSRISTICS : 

(A) LENGTH: 5727 base pairs • 
r (B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



3B40 
3900 
3950 
4020 
4080 
4140 
4200 
4260 
4320 
4380 
4440 
4500 
4560 
4620 
4630 
4740 
4800 
4932 



45 



SO 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 190: 
CAAAGCTGTT CAAAAGGCTT ATAATTTAAA TTTAGATAAC ATACGTACAA TGGAACCTAA 
GTTGAGATAT CAAGCGATCA ATAAAGGTAA TATTAATTTA ATAGATGCAT ATTCAACTGA 
CGCTGAATTA AAACAATATG ATATGGTTGT GTTAAAAGAT GATAAGCACG TATTTCCACC 
ATATCAAGGA GCACCATTAT TTAAAGAAAG CTTTTTAAAG AAACATCCAG AAATTAAGAA 
ACCGTTAAAC AAACTAGAAA ACAAAATATC TGATGAAGAT ATGCAAATGA TGAACTATAA 
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GTTAATCAAA TAACGACCAA CGCCACATAA GATGCGTAAC ACCAAATTAT ATCTTATGTG 420 

GCGTTGTTAT ATTTAAATCT ATAATTATGT TCAATTTAAA CATGCAATAA TGATTAAAAA 480 

ATATGACATG TTAAACACAA TGTAAGCTAT TATGATGTGA AAATAGTAGC ATTGCATTTT 540 

AGAAACATAG AGCGATATAA TGAATATAAG TTTTTTGAAA TTTCAGTTAA TTCTAAGGAG 600 

GTTGTTTTTA TTATGAAAGA ACAACTTAAT CAACTATCAG CATATCAGCC TGGTTTATCT 660 

CCAAGGgCAT TGAAAGAAAA GTATGGCATT GAAGGAGATT TATATAAACT TGCATCAAAT 720 

GAAAATTTGT ATGGACCATC GCCTAAAGTT AAAGAAGCGA TATCAGCACA CTTAGATGAG 780 

TTATATTATT ATCCTGAAAC AGGATCACCG ACATTAAAAG CGGCGATTAG TAAACATTTA 840 

AATGTAGATC AATCACGCAT TTTATTTQGT GCGGGATTAG ATGAAGTTAT ATTAATGATT 900 

TCTAQAGCTG TATTAACGCC AGGGGATACT ATTGTTACAA GTGAAGCGAC ATTCGGTCAA ^60 

20 TATTATCACA ATGCGATTGT TGAATCAGCT AATGTGATAC AAGTACCTTT AAAAGATGGT 1020 

GGCTTCGATT TAGAAGGTAT TTTAAAAGAA GTTAATGAAG ATACGTCATT GGTATGGTTA 1080 

TGTAATCCAA ATAATCCTAC AGGTACATAT TTTAATCATG AGAGCTTAGA TTCGTTTTTA 1140 

25 TCTCAAGTAC CTCCACATGT ACCAGTAATT ATAGATGAAG CTTATTTTGA ATTTGTGACA 1200 

GCAGAGGACT ACCCGGATAC ACTTGCTTTG CAACAAAAAT ATGACAATGC TTTCTTATTA 1260 

CGTACATTTT CAAAGGCGTA TGGATTAGCG GGTTTACGTG TAGGATATGT GGTAGCAAGT 1320 

GAACATGCGA TTGAAAAATG GAACATCATT AGACCACCAT TTAATGTGAC ACGTATATCT 1380 

GAATACGCAG CAGTTGCAGC ACTTGAAGAT CAACAATATT TAAAAGAGGT AACACATAAA 1440 

AATAGTGTTG AACGCGAAAG ATITTATCAA TTACCTCAAA GTGAGTATTT CTTGCCAAGT 1500 

CAAACGAATT TTATATTTGT AAAAACmAAG CGGGTAAATG AACTTTATGA AGCACTTTTA 1560 

AATGTAGGGT GTATTACGCG ACCATTTCCA ACTGGTGTTA GAATTACAAT TGGTTTTAAA 1620 

GAACAAAATG ATAAAATGTT AGAAGTTTTA TCAAACTTTA AATACGAATA GTAAGTGGGG 1680 

AGTGGGACAG AAATGATATT TTCGCAAAAT TTATTTCGtC GTCCCACCCC AACTTGcATT 1740 

GTCTGTAGAA ATTGGGAATC CAATTTCtCT TTGTTGGGGC CCCGCCGGCA AGGTTGACTA 1800 

45 GAATTGAAAA AAGCTTGTTA CAAGCGCATT TTCGTTCAGT CAACTACTGC CAATATAACT 1360 

TTGTAGAGCA TTGAACATTG ATTTATGTCT CAAGCTCAAT GCAGTGTGAA TGATGAGGTG 1920 

AGAGTATTCA GTGTAAAAAG CAACAATAGA TGATATTGTT TTGTATCAAT TGCTTTTTTG 1980 

5^ CTATACTGAA TCAATACTGA TATTTTCAGG AGAAGATTAA AATGACCCGT AAATCAATCG 2040 

CGATTGATAT GGATGAAGTA TTGGCAGATA CATTAGGAGA AATCATTGAT GCTGTCAATT 2100 
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rrCCTGAACA TGATGGATTA ATTACAGAAG TATTGAGAGA ACCAGGCTTC TTCAGACATC 2220 

TTAAAGTGAT GCCGTATGCA CAAGAAGTTG TGAAAAAATT AACTGAACAT TATGATGTAT 2280 

^ ATATTGCTAC AGCAGCAATG GATGTACCAA, CATCATTTAG TGATAAATAT GAATGGTTAC 2340 

TAGAGTTCTT TCCATTTTTA GATCCTCAGC ATTTTGTTTT TTGTGGTAGA AAAAACATCG 2400 

TTAAAGCTGA TTATTTAATA GATGACAATC CTAGACAGCT TGAAATTTTT ACTGGTACAC 2460 

10 

CGATTATGTT TACAGCAGTG CATAATATTA ATGATGATCG ATTTGAACGC GTAAATAGCT 2520 

GGAAAGATGT AGAACAGTAT TTTTTAGATA ATATTGAGAA ATAAAATATA TCACTTGAAA 2580 

AATTTCATGT AGAAAAGATG ATGGATAGGC TATAAAGTAA TTGTGACTGA GATGAACTTT 2640 

75 

TATGTCTTAG ACACTACAAC ACTATATTGG CAGTAGTTGA CTGCGGGGCC CCAACATAGA 2700 

GAAATTGGAT TCCCAATTTC TACAGACAAT GCAAGTTGGG GTGGsCCCCA ACATAAAGAA 2760 

20 ATACTTTTTC TTTAGAAATT AGTATTTCTT ATGCATGAGT GTAACTCATG CATTCATATT 2820 

TTTAAGTACA CATTAGCTGT GACTAATGAT AAAGAATCGC TACATAATCA ATCATTAGTC 2880 

GTTCTTTATC ATTTCCGTCC CGCTCTCAAT AAATGTTAGT CTATCTTATT ATTATAAATC 2940 

25 GGATGAATGT GTTAATCTAT GGCAGATTAC ACGTCATCCG ATTTTTTATA GAATTTGAAA 3000 

AAGACGCATA AACCACTATG ATTTAAAATA CAACATCAAT CATTTTAGTG gCATGCGCCA 3060 

AAATTATATG TCTGTTTTTG AAACAGGGTA ATAGCTTAAA GCTAATAAAA ACGAATATAA 3120 

30 

GGTGCGTTGA ATCTTATGAT TACACTCCAA ACCTAATATA ATATCGGGTT AAGATCATTC 3180 

CGGATGCTTA CAAATCATTG ACAGTAAGTA ACTGAATGGC ATTTGGTATA ACCTCAATAT 3240 

CAATAGGTGT TTCTAATGAA ATTTCGCCAT CAATATCAAC TTTCATTGCT GGATCTGTTG 3 300 

3S 

TAAGTGAAAT CTTTTTACCA GGTATATGCT CAATACCTTG AGTAATTTCA TTCCaATTCA 3360 

TGCTATCACG CTTTTTAAAA ATATCATTTA AAATACTGAA ACTTTGTTCA XTAAAAATGA 3420 

AAGTGTTCAG TTCACCATCT TGAGGAGACA AATCAGTCaA TGGTATACGA CTACCACCAA 3480 

40 

TGAATGGACC ATTTGCTGTT AGTATCATGG TCGTTTCGCC AGAATATGTC TTATCATCTA 3540 

TTGATAATTG ATAATTAAAT TGTGTTGGAT TTAGCAGTGT TTTGACAGTT GATCCAATAT 3600 

45 AACTCAATTT ACCAAATATA TCTTTTGAAC CATCTTGTAC GTTTTCAGCG TTTTGAACAA 3660 

TGAGACCTAA GCCAACAAAG TTGAGTGCAT ATTGATTATT TATTTTAATT ACATCGTATG 3720 

TACCAACTTG TGCAGAAATC ATTTGTTGAC TAGCTTGTTT ATGATTAGGT GCTATATTTA 3730 

GCGTTTTTGT AAAATCATTA AAAGTACCGC CTGGTAAAAT GCCAATAGGG AGTTGAAGGT 3840 

CATGTGTCAT AACACCGTTT ATAAGTTCGT TAACCGTGCC ATCACCGCCA AGAATAAATA 3900 
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CACCTTCGTT 


TTCACTCAAT 


TGAATAGAAA 


GATGCTTACA 


AATTGAACTT 


AATGCTGTTG 


4020 




TAACTTCCCC 


AATACCTTGA 


TTAATATTTT 


TTAATCCACT 


GTGTTCATGG 


TAAAAGAGGA 


4080 


5 


CACCATGTGT 


ATATTTATTT 


TCCATAGTTT 


AGCCTACTTT CTAAAAATTG 


GTTCATTAAA 


4140 




TATATATACC 


CACTTTTAAT 


TGTTAATACC 


AAAAATATGT 


TTTTAAATAG 


AGAAAATGGT 


4200 


10 


AATAAATGAA 


ATTGATTTCT 


ATAGAGTGGG 


ACGAGAAAAT 


ATAGTTATAG 


CTGTCTATAA 


4260 


TGAGCATATT 


AAGTTTTTAT 


TTATACTGAT 


ATCTTGAATT 


TAATTAATAG 


AAACCTATAA 


4320 




AAAAACAGTA 


AGCCATTTAA 


ATGACTTACT 


GTTTTTTGAA 


TTAGGCCAAC 


AATATTAACG 


43B0 


IS 


TATACCTTTC 


ATCGCTTTGA 


TGATTAAAGG 


TGAGAATGCT 


AATACAATTG TTGTAACAAT 


4440 


AATTGCAACA ACACCTAGGA AAATAAAGTA ATTTGTTTGA 


CCTAGTGGTT 


CTATTAACTT 


4500 




AACTAAAGTA 


CCATTGATTG 


CTTGTGCAGA 


AGCGTTAGTT 


AAGTACCAAA 


TACTCATCAT 


4560 


20 


TTGGGCATTA AATGCTTTAG 


GTGCTAACTT 


AACAGCAGCA 


CTATTACCCG 


TTGGTGATAA 


4620 




GCATAGCTCA 


CCGATAACAC 


AAATAATGTA 


CGATAAAATA 


ACCCAGTTAA 


CTGAAAAGTT 


4680 




TGATGAACCT 


GATGCATAAC 


CTACAATACC 


AATTAGTATG 


TATGACGCAC 


CTGCTAAGAA 


4740 


25 


CGTACCAATT 


GCAAATXTTA 


CTGGCAGGCT 


AGGTTGTTTA 


GTTCCAAGCT 


TTTGCCATAA 


4800 




AAGTGAAATA 


ATTGGAGCTA 


GTAATAAAAT 


AAATAATGGG 


TTAATTGATT 


GGAAGATCGC 


4860 




TTCACCAAAG 


TTTGTTTTCC 


AACCAAATAA 


GTTTAATTTC 


ATATCTGAAT 


GTTCAATTCC 


4920 


30 


ATATATGTTT 


AATACATTAG 


ACCCTTGTTC 


TTGAATAGCC 


CAGAACACCA 


TTCCAAGAAT 


4980 




AAATAATGGA 


ATAAATGCTT 


TAACACGAGA 


ACGTTCAGTA 


TCAGTGACAT 


CTTTACTTCT 


5040 


35 


AATAATTAAA 


GTGAAGTAAA 


TGAnTGGTAA 


TGCAATACCT 


AATACTAAAA 


CAGTATTACT 


5100 


AACTAAGTTA 


AATGATAATG 


AGTTAGTTAA 


TGCACCAATA 


ACGATAATTA 


ATACAATTGC 


5160 




TAAJiACAACA CTTCCGATAA TAAGACCATA CTTTTTCTTT 


TCAGCTGGTG 


TCAATGGGTT 


5220 


40 


AGTAGGTTTC 


ATACCAACGC 


TACCTAAGTT 


TTTGCGGTTG 


AAAAGTACAT 


ACCATACTAA 


5280 


ACCTAATGCC 


ATACCAACTG 


CTGCAATCAA 


GAATCCGCCG 


TGGAAGTTTT 


TAACATTAAC 


5340 




AAAGTGTTGC 


AAAATAATAG 


GTGATAATAA TGCACCCATA 


TTAACTGACA 


TATAGAAAAT 


5400 


45 


AACAAAACCT 


GCATCCATAC 


GTCTATCATT 


TTCAGGATAT 


AAACGGCCAA 


CGATATTTGA 


5460 




AATGTTTGGC 


TTCATTAAAC 


CTGAACCAAT 


AATGATGAAG 


AACATTGATG 


TGAATAAGCC 


5520 




GATTAATGCA 


AATGGTAAGC 


TTAAACAAAT 


ATGTCCGATA 


ATAATAAAGA 


CTGCACCTAA 


5580 


SO 


TAAAGTAGCG 


CCTCTAGTGC 


CTGTAATTCT 


GTCAGCAATC 


CATCCGCCTG 


GTATTGATGT 


5640 




CATATAGATT 


AATGAACCAT 


ArACTGACAT 


AATTGACATA 


GCTGTTGTTT 


TATCAATTCC 


5700 
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(2) INFORMATION FOR SEQ ID NO: 191: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 14078 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : doilble 

(D) T0POtX3GY: linear 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 191: 
TGGACTATTA ACGGCGaAGA AGATTTAACG AAATACTTAC AAACCAATGT TGATGGTATT 
ATCACAGATG ACCCAGCATT AGCTGATCAG ATTAAAGAAG AAAAGAAAGA CGAAACATAC 
TTCGATCGTT CTATAAGAAT TTTGTTTGAA TAATATAAAC AAAGACCTCT AAAGTTATCA 
AGATGATACC TTCAGAGGTC TTTTTAATGT TGCCATCTAT GGGATAGGCA ATCGTTTCAT 
TCGTTTATAT TCATATGACA AGTATTTGTA TGGCAATTTG GCGTCACAAA CACTTACATG 
ATTTATTGGT GAATTATTAA TTGTTTTGTG AATGCAAAGG GTTAGAAATT GAATTGTAAA 
TACTTTCTAA TCTTTGTTTC GCTTTAGTCA TTTGATCCAA ATTTTTAGTG CGTATAGCGG 
ATTTTGCAAT ATAGTGCGCA CTAAAATATC GCGTTTTTGA AACGCATCTA AATTTAGGTA 
CGATAATTTA TTTAAGTCAG TGTTTGCTAT TAATTCATGT AATTGATCTA CAAGCGCTTG 
ATGTTGATAC GTATGTGATG TAGTTTCAGA TTTGCTTGCT AATTTAATAC CAGTCGTATC 
AAGGAGCGCC GCTTTAATAC CAGCAACTAA ATATGTTTTG ATTTTCATTT GTGTTGTCAT 
GCTTTGTTAC TCCTTTGATG TACATTAATC AAAAAAATTA TACACTATTG TATATTGCAA 
AGCTAATTAA CTATAACAAA AAGATAGTTA ATGCTTTGTT TATTCTAGTT AATATATAGT 
TAATGTCTTT TAATATTTTG TTTCTTTAAT GTAGATTGGG CAATTACATT TTGGAGGAAT 
TAAAAAATTA TGAAAAAGCA AATAATTTCG CTAGGCGCAT TAGCAGTTGC ATCTAGCTTA 

ft 

TTTACATGGG ATAACAAAGC AGATGCGATA GTAACAAAGG ATTATAGTGG GAAATCACAA 
GTTAATGCTG GGAGTAAAAA TGGGACATTA ATAGATAGCA GATATTTAAA TTCAGCTCTA 
TATTATTTGG AAGACTATAT AATTTATGCT ATAGGATTAA CTAATAAATA TGAATATGGA 
GATAATATTT ATAAAGAAGC TAAAGATAGG TTGTTGGAAA AGGTATTAAG GGAAGATCAA 
TATCTTTTGG AGAOAAAGAA ATCTCAATAT GAAGATTATA AACAATGGTA TGCAAATTAT 
AAAAAAGAAA ATCCTCGTAC AGATTTAAAA ATGGCTAATT TTCATAAATA TAATTTAGAA 
GAACTTTCGA TGAAAGAATA CAATGAACTA CAGGATGCAT TAAAGAGAGC ACTGGATGAT 
TTTCACAGAG AAGTTAAAGA TATTAAGGAT AAGAATTCAG ACTTGAAAAC TTTTAATGCA 
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GTTGTATCAT ATTATGGTGA TAAGGATTAT GGGGAGCACG CGAAAGAGTT ACGAGCAAAA 
CTGGACTTAA TCCTTGGAGA TACAGACAAT CCACATAAAA TTACAAATGA ACGTATTAAA 
AAAGAAATGA TTGATGACTT AAATTCAATT ATTGATGATT TCTTTATGGA AACTAAACAA 
AATAGACCGA AATCTATAAC GAAATATAAT CCTACAACAC ATAACTATAA AACAAATAGT 
GATAATAAAC CTAATTTTGA TAAATTAGTT GAAGAAACGA AAAAAGCAGT TAAAGAAGCA 
GATGATTCTT GGAAAAAGAA AACTGTCAAA AAATACGGAG AAACTGAAAC AAAATCGCCA 
GTAGTAAAAG AAGAGAAGAA AGTTGAAGAA CCTCAAGCAC CTAAAGTTGA TAACCAACAA 
GAGGTTAAAA CTACGGCTGG TAAAGCTGAA GAAACAACAC AACCAGTTGC ACAACCATTA 
GTTAAAATTC CACAGGGCAC AATTACAGGT GAAATTGTAA AAGGTCCGGA ATATCCAACG 
ATGGAAAATA AAACGGTACA AGGTGAAATC GTTCAAGGTC CCGATTTTCT AACAATGGAA 
CAAAGCGGCC CATCATTAAG CAATAATTAT ACAAACCCAC CGTTAACGAA CCCTATTTTA 
GAAGGTCTTG AAGGTAGCTC ATCTAAACTT GAAATAAAAC CACAAGGTAC TGAaTCAACG 
TTAAAAGGTA CTCAAGGAGA ATCAAGTGAT ATTGAAGTTA AACCTCAAGC AACTGAAACA 
ACAGAAGCTT CTCAATATGG TCCGAGACCG CAATTTAACA AAACACCTAA ATATGTTAAA 
TATAGAGATG CTGGTACAGG TATCCGTGAA TACAACGATG GAACATTTGG ATATGAAGCG 
AGACCAAGAT TCAATAAGCC ATCAGAAACA AATGCATATA ACGTAACAAC ACATGCAAAT 
GGTCAAGTAT CATACGGAGC TCGTCCGACA TACAAGAAGC CAAGCGAAAC GAATGCATAC 
AATGTAACAA CACATGCAAA CGGCCAAGTA TCATACGGAG CTCGTCCGAC ACAAAACAAG 
CCAAGCAAAA CAAACGCATA TAACGTAACA ACACATGGAA ACGGCCAAGT ATCATATGGC 
GCTCGCCCAA CACAAAACAA GCCAAGCAAA ACAAATGCAT ACAACGTAAC AACACATGCA 
AACGGTCAAG TGTCATACGG AGCTCGCCCG ACATACAAGA AGCCAAGTAA AACAAATGCA 
TACAATGTAA CAACACATGC AGATGGTACT GCGACATATG GGCCTAGAGT AACAAAATAA 
GTTTGTAACT CTATCCAAAG ACATACAGTC AATACAAAAC ATTACGTATC TTTACAACAG 
TAATCATGCA TTCTATGATG CTTCTAACTG AATTAAAGCA TCGAACAATC GGAAGCATAT 
TTCTAAATTA TTTATTCATT ATAGTCTTAA ACATAACATG ACCTAATATA TTACTAACCT 
ATTAAAATAA ACCACGCACA TCTAAGTGAT ATACGACAAT CACAGCAATA ATAATTGCTT 
TAGAAAGTCG TGCCGAACTG GAACTTACAA GTCTAGTTCG AACACACACT GATGTGAGTG 
GTTTTCTTTA TTTTAAACAT GAACAATCAG ATAAGTTACT AGCATTAGCA AATATTATTA 
AATCAAAGGG CTTCGATTCA TAAAATTTAA AACAATGATT AAAATTAGAC GTGTAAATGT 
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TATTTCACAC AGCTTCATTA ATAAAACGAA ATTGCTTCAA CCCGCTTCAA CTTCAACTGG 3300 

CTTCAACTTC AGCCTACTTC ATTCAATAAC AAAACGAATC CGCTTCATCC AAAATCAACC 3360 

ATTCTAACGC ACATATTCAA ATATAGCAGC TGCACCCATG CCGACACCAA TACACATCGT 3420 

AACCATGCCG TAACGGCTAT CGGGACGTCT ACCCATTTCA TTAAGTAAAC GCX3CGGTTAA 3430 

CATTGCGCCT GTAGCACCTA ATGGATGACC TAAAGCAATA GCGCCACCAT TCACATTCGT 3540 

■ ♦ 

ACGTGATATA TCTAGACCTA CTTCTTTAAT AGATGCAATC GTTTGAGAAG CAAATGCTTC 3600 

GTTCAATTCG ATCAAATCAA TGTCTTCAAC AGATAGATTG CTGAGTGACA ATACTTCAGG 3 660 

AATCGCATAT GCAGGCCCAA TACCCATAAT TTTCGGGTCA ACGCCTACTG CCTTAAAACC 3720 

AACGAATCGT GCAATAGGTG TCACGCCGAG TTCTTTCACT TTATCTCCAG ACATTAAAAC 3780 

TACAAATCCT GCACCATCAG AAAGTGGGGC AGATGTTCCT GCAGTCATAG TGCCGTCAGC 3840 

TTTAAATACT GTACGTAATT TGGCTAATGC CTCCATCGTG GTGTCAGGGC GTATAAATTC 3900 

ATCTTGGTCA AAGATATTTO TGTGTACTTT TGGTCCTGCG TTTGTATATT CAACTGAGTT 3960 

TACTTGTATT GGAATAATTT CATCTTTGAA CCGACCATCA CGTTGTGCGT CATAGGCACG 4020 

25 TTGATGACTT CTGACAGCAT AAGCATCTTG ATCTTCGCGT GATACGTCAA ATTGGGATGC 4080 

TACATTTTCA GCAGTTAAAC CCATAGGATA TGACGCACCT ATATCATCAT ATTGTAAGGT 4140 

TGGATTGTTT GTGGGCTCGT TGCCACCCAT TGGTACGGCA CTCATCAATT CAACGCCACC 4200 

30 AGCTACAAGT ATATCTCCTT GACCAGCCAT AATTTGATTG GCTGCAATCG CGATGGTTTG 4260 

TAATCCTGAT GAGCAGTAGC GATTCACTGT TTGACCCGGT ACCGTGTCAG ATAATCCCGC 4320 

ACGCAATGCA ATCGTTCGTG CAATGTTTTG GCCTTGTAAT CCTTCTGGAA AAGCCGTACC 4380 

AACAATGACA TCTTCAATCA TATTCTTATT GAATTTTCCG TCAATACGTT TCAATACGCC 4440 

TTG1AATACT TTGGCTGCGA CATCATCAGG TCTTTCGTGG AATAATGCGC CTTGCTTTGC 4500 

TTTCGCTGCG GCTGAACGCC CATAAGCTAC AATGTATGCT TCTTGCATGG TTATCATCCT 4560 

CTCTTAATGA CTATCTTTTA ATTACGTAAT GGCTTACCAG TTTTTAACAT ATGTGCAATT 4620 

CTTTCATATG ATTTTTTAGA TTTTAGTAAG TCAATAAAGC CAATTTTCTC CAACGATTGA 4680 

ATGTAACGTT GATTGATAAA TGTATTTCTT GGTAAATCAC CACCCGCTAA AATTGTGGCG 4740 

ATATTTAAGG CAATATGATA ATCATGGTCG CTAATAAAAT GACCCCGTCT TTGCGCATCT 4800 

AATTGTCCTT GGATCAATGC TTTGAAGTCT TCACCTAAAG CGATATATTG ATGTCTAGGA 4360 

SO TTCGGAATAT AGTTTGTTTC TGCTTCATAT TTCGCACGTT TGAGCGCAAC TTCGACACGT 4920 

TGTGCTGTAT TGAAAATAAT CGTATCTGTA TCACGTAAAT AACCATAACG ACGTGCCTCA 4980 
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TGTTTGTCAT CAAACTTATG CGATGTGCGT AATATGCGAT CAGCCATTTC TGCAAGGCCA 
CCGCCACTCG GTAATAAGCC AACACCTGCT TCAACAAGAC CGATATATGT TTCACTTGCA 
GCGACAACAA TAGGTGAGTA AAGTACAAGC TCACAGCCAC CGCCTAAGGC ACGACCTTGA 
ACAGCTGTGA CTACTGGTTT CAAACTATAC TTCAAACGAT TAAAGCTATA ATGTAATTTA 
TCAATTGATT GTGCAACGAC ATCATCTACA AGACCGTCTT CATGCGCCTT TTTCATTAAG 
AAAAGGTTAG CACCCACACT GAAATTGTTA CCATCTGCAT AAATAACCAT ACTTGTGTAA 
TGGTCATTTT CCAGTAAATC AATCGCATCA ACTAACGCAT CGTTGAATTC ATCGGTAATG 
ACATTATTTT TACTTTGTAA TTTCAGTAAC AGTTGATCAT CATGAGTTAC GGAAAGTTTG 
GCATCACCTT TATCCCAAAG TTCATCTTTT ACGAAGTGAG AAATAGGTGT TGCATATTCA 
ATGGTCTCAT CTTGTTTATA AAAGCCACCA TCTAAATCAC TAATCCATTG TGGTAAGTCT 
CCAAGTTCGT CTTCCATACG TGTTTTAACA CGTTCGTATC CCATTGCATC CCATAATTGG 
AATGGACCAA GTTTCCAGTT GAACCCCCAG ACAAGCGCAC GGTCTATGTC TCGGAAATCA 
TCGGTAGCTT TAGGTACATT GATAGCAGAG TAATAGAAAT TATTACGTAA TGTCTCCCAT 
AAAAATAGTC CCGCTTCGTC TTGCGCATTG AATATGGTAT CAAGGTTATG CACTAAGTCT 
TTATTAAATT CATTTAAAAT TGGTAATTGT GGTTGCGATA CAGGTACATA ATCTTGTTTT 
TCAACATCGT AAACAAGTCG AGCTTTAGTT TCTTTATCCT TTTTGTAAAA TCCTTGTTTC 
GTTTTACGTC CGAGTGCGCC ATTGTCAAAC AACGTATTTA CAATTTTGAC ATCATGAAAA 
TAAGGTGTTT CTTCAGGTAC TTGTTGCATG CCTTTAATTA CAGACACTGC AATATCTAAA 
CCGACTAGGT CAGATAGCGC ATATGTACCT GTTTTAGGAC GACCAATCGC TTGCCCAGTT 
AAAGCATCCA CATCTACAAT GCTTATCTTG TGTTGCTCGG CGCGATACAT AATATCATTC 
ATTC3TTTGCG TGCCGACTCT ATITGCGACA AAGCCAGGCA CATCATTGAC GACAATGACA 
CCTTTACCTA ACACATTTTG CGCGAAATTT TTTACATCTA ATATAATAGA TTCCTTCGTG 
TGTGACGTAG GTATTAACTC CACTAATTTC ATAATACGTG GTGGGTTAAA GAAATGTAGA 
CCAAAGAATC GTTCTTGATC CTTCTCGTTA AATGCTTGAG CAATCGCATT AATTGGAATA 
CCTGATGTAT TTGTAGCGAA TAAAGCATCT TCTTTAGCAT GTTGTAGAAC TTGTTGCCAA 
ACAGCATGCT TAATTTCAAT ATCTTCTTTG ACTGCTTCGA TATATAAATC AGCATCATCA 
TTTACCAAGT CATCATCAAA ATTACCATAT GTTAAATGAC TCGCTAGATT TAAGTCGAAT 
AGTAGCGGCC GTTTCTTATC TGTAATTTTA TCGTAAGATT TTTTCGCAAT GAGATTTGGA 
TCGTTTTTGT CCACTACAAT ATCTAATAGT TTTACTTTAA GTCCAGCATT CACAAAAAGT 
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GTGATTCCTC CAATTTAGTT GAGGATAAGA TAACCATTAA GATAATTGGA ATAACGTTGC 
TATTTTATAA AATTAATTAA GTATCTTTGA CAGTCATCTT AGCCTCTTAT TTAAGGAAAA 
AGCTTTATGC TTAAAATAAG TCTTTTTTAG TGAAATTAAT GCATCTCATA TAATTATTTG 
CTATTTATAC GAAAGCAGAA TCTCCAGTCA AAGCXSCGTCC AATTACTAAG GCATTAATTT 
CATGTGTACC TTCGTACGTG TAAATCGCTT CTGCATCAGA GAAGAAACGT GCAATATCAT 
AATCGTCAGC TAGTATGCCA TTACCACCTG TAATACCGCG GCCCATAGCT ACTGTCTCAC 
GCAAACGTAA GGCATTCATC ATCTTCX5CCG TTGAAGTTGC AACCTCGTCA TATTCACCAT 
GTGCTTGCAT ATTAGCTAAT TGAGCACATG TTGCCATTGC TTGAGCTAAA TTACCTTGCA 
TCATTGCTAG CTTTTCTTGT ATTAACTGAT ATTTACTAAT TGGTTTGCCG AATTGcTTAC 
GCTCAGTGAC ATAATCTAAT GTGGCACGTA AAGCGCCAGC CATACCACCT GTAGCCATAT 
AAGCAACGCC TGCTCTCGTT GAATAAAGAA TTTTGGCAAT ATCTTTAAAG CTTGTTATGT 
TTTGTAAGCG ATCCGCTTCA TCTACTTTGA CATTAGTTAA TTTAATTAGG GCGTTAGGAA 

caatgcgaag tgcgatttta ttatcaaxga cttcaatatc gacgccatct tgttctggtc 
tgactacaaa gcaatggggt ttgccagttt ctttatttac tgcgaatact ggaatgacat 
cagatacatg tgcaccacca atccatttct tttcaccatt gataacccaa gtatcgcctt 
ggcgttcagc gactgtttca agacctcccg c/^acgtccga accgtgttct ggttcagtta 
aagcaaagca tgtacgcagt tcatgtgact gtaatttagg tacatatttc gcaatttgtt 
ctttgctacc tccgaaatag aaagtgttat gccctaaacc ttggtgaaca ccgagtaggg 
tagctaagga aatatcaaat cgcgcgagta ggtaagacat gaaaaactga aatagttgac 
taggcatttt ggcgtttgga cgatccttgt aaagtaatgg attgttaaaa taatttaatt 
ctc&:agatc tttaaaatag tcctcgggta cagtagcgtc tatccaatgt tgattaatat 

TTTCACGGTA CTTACTTTCT AGCAATGAAT CTACTTGTTG TAAAAATTCG ACTTCACCGT 
CTGTTAAACC TTTAGCAATA CTAAGTACAT CTTCAGGAAA TAATGTTTTT AAGACCGTTT 
CTTTTTCAAA TGTCATATAA ATTCCTCCTA AAAATAATAT GAATACTAAT GTGAAATGCA 
TTTAATTCAA AAACAACACG CTTTATTTGT AAACGCTTAC ACTAAATGTC AAAAATTTTT 
ATCACCTTTA AAGTGTTTGC GAGACTTTGT CATTCATCAT TTGTCGAATC GCAAGTTTAT 
CTGGTTTCTG CGTACTGTTT AACGGCATAT GTGTCACTGG TACATACATT CTTGGGACTT 
TATAACCTGC TAAAOGACTt CGCATATGTT GATTTAAAAT TTCAGCGTAA TGAGGTTCAT 
. CTTCGCGAAG TATAATGGCT GCAGCAATTG ATTCACCATA TTTTGGATGA TCATAGCCAA 
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AGACATTTTC GCCACCAGTT ATGATTAATT CTTTTTTGCG GTCAATAATA AATATATCGC 
CATCGTTGTC CATCTTCGCT AAGTCACCAG TTAATAAATA TCGACCATGA AATGCTTTGG 
CAGTCTCTGC TGGTTTATTC CAATATCCTG GCGTGACATT TTTAGCCTTA ATTGCAAGTT 
CGCCAATCTC ACCAGTAGGT ACTTCCTCAC CGTTATCATC AAGGATACGT GCATCAACGA 
ACATGACTGC TTTACCAATA CTCATTGGCT TACGTTTTGA ATTTTCCGGT GTATTAACAA 
GTACAAGAGG TGCTTCAGTT AAACCATAGC CGTTAATAAT GTTTATGCCA TATTGTTTAA 
AAGCTGCTTG GATACTTGGT AATGGTTGTG AACCACCTTG GATGATATAA TCCATAGCTC 
TAAAATTTTC AGGATTAAAA TTACTAGCAC GTAGCGTACT ATAATACATT GTCGGAATCA 
TGATAATAAA TGTAGGGTGA TATTGTGCAA TCATGTCATT CAATTCTTCG CCGTTAAAGT 
AACGTTGAAG AATAAGTGTG CCACCTGACA TTAATACTGG TAATACAGTA TCGTTAAACC 
CTAAAACATG GAACATTGGT GTTGATACAA TCGTAATATA GTTTGAATTG AACTTATACG 
TCAGCTCTAA GTTTGCACCG TTATGAACAA ATGATTCATA TGAGAACATC ACACCTTTAG 
GTGATCCGGT TGTACCACTT GTATAAATTA ATGCTGCAAG ATCTTGTGGT TCAACAGGTG 
TTGCTTGAAA AGGTTGGTGA TAATCTGGAT TTACGATTTC ATCATATTGC GCCACATCAA 
TATCCATATG CAATAAGTTT TGGTCAATAT CGGTGAGTGA ACTTAAATGT TTTTCAGCAT 
AGAAGAGCAG TTTTAATTGT GCATCTTCCA CAATGGCTGC AATTTCTTTT GGGTTAAGCC 
GCCAATTCAA TGGTAAAAAA ACCGCACCTG TTTTAAAACA AGCAAACAAT AAATCTAATA 
TTGCAATATC ATTTGGOGCA AAAATACCGA TAACATCGCC TTTTTTAACA CCTTGAGATG 
TTAAATAATG TGCCATATTA TCAGCXSCGTG CATTGAGTTG TTGGTATGTC CAAGATGTTT 
GTTTTGCG7G ATCAATAACG GCAGGCTTGT CATCATCGAA GTCTGAACGC GTTTTTATCC 
AATCGAAATT CATTAGTATA CCCCCTTTAG CTTCACTTTC ATACTTTATG AATTGATTGT 

to 

TTAAGTTGTC CCCATTTTTC TTTGTAAATG CTGGTATCAA TTAATTTTAA ATGATCAGCA 
ATAATTGGTT TAAAAGCCAT TTGATTCAAA ATATCTTTAT GCAAATCAAG ACCTGGTGCA 
ATTTCAATTA GTTTCAAGCC TTGATTGGTG AGTTCGAATA CTGCACGATC AGTAACAAAA 
TAGATTTCTT GCTCGAGTGA TTGTGAATAT TGTGCATTAA AGTCGATATG GCTCACATCT 
GATACAAATT TCTGGTTTTG TCCTTCAGTT TCAATGTTTA ATCGTTGATT ATGGCATGAG 
ACATGACTGC CAGCTACAAA AGTACCTGAA AAGATAATTT TATTTACAGA TTGCGTAATG 
TCTATAAAGC CACCACATCC ATTTAGTCGG TCATTGAAGT AAGACACGTT GACATTGCCG 
TATTGATCAA CCTCAGCAAA GCTAAGATAG GCAACTGATA CACCATTGTT ATAAATAAAA 



8700 
8760 
8820 
8880 
8940 
9000 
9060 
9120 
9180 
9240 
9300 
9360 
9420 
9480 
9540 
9600 
9660 
9720 
9780 
9840 
9900 
9960 
10020 
10080 
10140 
10200 
10260 
10320 
10380 



55 



692 



EP0 786 519 A2 



10 



15 



20 



25 



30 



35 



40 



45 



SO 



CGACTCCCAA CGAATCCACC GAAAATGCCA ACATCTAAAA TCGGTTGCAC ATCATGTTCA 10500 

ACACATTCTT CATGCAATAA ATTAGAGAGT TCATTATTGA TGCCATAACC GATGCTAATT 10560 

GTATCGCCAT AAGTTAAAAA CTGAGCAGCA CGTCGGAGAA TCAATTTGCG ACTATTAAAA 10620 

GGTAATGCGG GTTCAGGTAT TCCATCAATT CGTTCTTCTC CAGACAAGGC TGGTAAATAA 10680 

TGACTTTGAA TTACTTGGCO GTGATTCTTT TCATCTTCTG TGACGTATAC ATAATCGACA 10740 

AGATTTCCTG GGATAACAAC TTCATTCGGT TTTAGTTGAT AGTCGTCAAC TAAAGCTTTA 10800 

ACTTGTACAA TAACTTTCCC ATGATTGGCT TTCGCGTTTA ATGCGACATG ATAACACTCG 10860 

CTCAAGTACG CTTCTTGAGT TAAATAAATG TTACCTTGTT GATCTGCGTA TGTTCCTCTC 10920 

AGTAGTGCCA CATCAACGCT AGGGAATGTG TAATGTAAGT ATGTTTCATC GTTGATGGTT 10980 

ACTAATGAAA CTAAATCATC CGTTGTTCGT GTATTTACTT TACCGCCACC GTATCTAGGA 11040 

TCAACAGCTG TGTTTAATCC GATTTTAGTA ATAACTCCAG GTAATAATTG ATTACTCTGA 11100 

CGATAATGAG TTGCAATGAT ACCTTGTGGT AAAAAATAAG CTTCAATGTC ATTATTTTTC 11160 

ATTGcTTGTG CCGTTTTGGA AGAAGCCGTT AAAATACTCA TAATGACACG TTTAATCATG 11220 

CGACGTTCTA TAAAATCATC TAAATCCGGT GCGGCACCTA AACTATGAAT ATCATTCGCT 11280 

AATATAAACG TTAAATCATT GGGCGTATGA TATGTGTCAT GTTGCGCTAA CACAGCACGT 11340 

AGAACTTCGG CGGGTAAGTT GGCTACAGCT AATGCTGGTA AACCAATCAC ATCACCATCT 11400 

TTAATGATAT GTTGTAAGTC GTGCCATGTG ATTTGTTTCA AGCAAGTCAC CTCCATCACA 11460 

TTTGATAAAA TATAGCGTTT TTACACTTTG TGTAAACCCT TaCAAGAAAT ATAACATAAC 11520 

GACGTTTAAA ATCAATTAGA AATATCTTTT TATTCTGATA ATAGACACAG TATAGACACA 11580 

TTTTGATGGT CGATAACAAT TGTAATATCA AGGGTTTGTA ATGAATTGAA TATCATTAAA 11640 

ATACfTATAT AAAAATATTG TTCGGAATAT AAAAAGTTAA ATAGGTTTTG ATTTTTAAAT 11700 

ATGAAATACA AAGTGCCCAA TCGAACAAAG TATTTATATT AAAATATGGA AAATCCATCA 11760 

ATATTAAATT AAAATAGTTT TATTATGAAA AGTGAAAGTA GGTAAGTCTA TGGAAGGTCT 11820 

TAATCATCGA AGAAATACAG AAAAAGAAGA GACAACACAA ACGCAAXCaG TTGCACCTAA 11880 

TACAGGTGAA GAGGGGATGT CATCAGCAAG TACACAATCA ACTAAGACGT CCGACATACA 11940 

TAATGAATCT ATCGATAAAC AAATGGAAGC TAAAGCGCAT GAAACAGCGC AAAATACAGA 12000 

TTTAAAAAAC GAAGCAAGAA GTTTATTTGA TAATGCAACC AAATCAATCG GTAGACTAGC 12060 

GGGCAATGAT GAAAGCTTAA ATCTTAATTT AAAAGATATG CTTTCTGAAG TATTTAAGCC 12120 

GCATACTAAA AACGAAGCAG ATGAAATATT TATAGCGGGT ACTGCTAAAA CTACGCCAGC 12180 
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TTTCACAGTA ACATTTATTG GATTATGGGT CATGGCAGCA ATTTTTAATA ACACTAACGC 12300. 

GATTCCGGGT CTCATTTTTA TAGGGGCTTT AACAGTACCA TTATCGGGTT TGTTCTTCTT 12360 

TTATGAATCA AATGCGTTTA AAAATATTAG CATTTTTGAA GTTATTATCA TGTTCTTTA7 12420 

TGGCGGCGTA TTTTCATTAC TAAGTACGAT GGTATTATAT AGATTTGTCG TTTTTAGTGA 124 80 

TCAATTCGAA AGGTTTGGTT CTTTAACATT TTTCGATGCA TTTTTAGTAG GATTAGTTGA 12540 

• * 

AGAAACTGGA AAAGCACTCA TTATTGTTTA TTTCGTCAAT AAATTGAAAA CAAATAAGAT 12600 

TTTGAATGGA TTATTAATCG GTGCTGCTAT TGGTGCAGGG TTCGCAGTTT TTGAATCAGC 12560 

AGGTTATATT TTGAATTTCG CTTTAGGAGA AAATGTCCCA TTATTAGATA TTGTCTTCAC 12720 

ACGTGCGTGG ACTGCGATTG GTOGTCATTT AGTTTGGTCA kCGATTGTTG GTGCTGCAAT 12780 

AGTTATTGCG AAAGAACAGC ATGGCTTTGA ATTCAAAGAT ATTTTTGATA AACGCTTTTT 12840 

AATATTCTTT TTATCAGCCG TTGTTTTACA TGGCATTTGG GATACATCTT TAACTGTACT 12900 

TGGCAGTGAT ACGTTGAAAA TATTTATTTT AATCGTTATT GTGTGGATAC TTGTATTCaT 12960 

TTTAATGGGG GCAGGTTTAA AACAAGTGAA TTTACTGCAG AAAGAATTTA AAGAACAACA 13020 

GAAAAAAGTA GACGAATAAT AATTAAAGCT TATGTTGCTC ATATGTTTGT GACATAAGCT 13080 

ATTTTTATAA TTTGTCTTTA AAAGAGTGGA ATAGGAATAC TTTTTGGAGT TAAAAAAGTG 1314 0 

TTtCACGTTA AACAAATAGT GACAATTAGA TTTATATAAA ATGAACATGA TTCACTGAAA 13200 

GTATGTAATA ATCATTTTAT TGAAATTCAT CAAACAGAAA TTAATACAAT CATATAAGCA 13260 
AATTAAACCA CGCCATAATC ATATTGGATG ACTTCGGCGT GGTTTTTATA GTTGAAGCAG " 13320 

GGCTGAGACA TAAATCAATG TCCCACACTC CCTTATCGTT CAATCGTTGT TCGATAATCG 13380 

ATTAAATAGA TACCTTCAGG TGTrACTTTA TAATTTTTAA CCTTAGAGTT AGCAGCGACT 13440 

ATTtBATCGT TGTAAGCAAT ATAACTGTTT GGTACATCTC GACTTGATAA TITAATAATA 13500 

TCATTAGAAA TATTGTGACG TTCCTTAACA TCTACAGTAT GATTCAATTG ATTAATTAAA 13560 

TCATCGACGT TGCTATTATT GTAGTCTCCT TTATTAATAG CACCATCTTT TTTATATGCT 13620 

TGATTAAAGA AATAACCTGT ATCTCCACGA GGAATTGTTC CGAAACTATA CATCGTTGCA 13680 

TCCCATGCAG AACGGTCTTT TAAGTAACCT TCTATGTCAT CAACACTTTT AATGTCGATT 13740 

TCAATATTTG CTTTTTT A GC ATCTGATTGT AATACTTGCG CAATTTTCGA TAGCTCTGGA 13800 

CGACCGTCAT ACGTAATTAA CTTAATTTTT AAAGGGTGTT CTTTTGTATA ACCATCTTTA 13860 

GCTAATAACA TTTTTGCTTG TTCGATATTT TGTTTGGTTA ACTTAGGTTC TTTAATATAT 13920 

GGAATTTTAT CATTAAATGG ACTCGTTGCA GGTTTCGCAT AACCTTGATA AATATGATCT 13980 



55 



694 



EP 0 786 519 A2 



TTATtAGTAT GATTATACAT AAGTaAGAAG TTCTAAAn 

(2) INFORMATION FOR SEQ ID NO: 192: 

(i) SEQUENCE CHARACTERISTICS: 

<A) LENGTH: 436 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNSSS; double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 192: 
TGAAAACTAA AGTGTTTCTA ATGCGTGACT AAAATTAGTA ATAATTAAGT TCTCATGATA 
ATAGGTATTT TTGAAAAATG GAGGAGTCTA TAAATGGGTA AAAAAATGGG TCTAGGTTTA 

m 

TCTATTGCAT TGGTTGTTAT TGGTATTGCC GTTGTATGTT TAATGATTTT TTCTAGTCAA 
AAAACGACTT ATTTTGGTTA TATGAATAGT AATACAAATG CAGAAAAAGT TGTCAGTGAA 
AAAGATGGAT TAGTCAAACA TAATATCAAA GTAGAACCAT CTAATGATTT CAAGCCGAAA 
AAAGGAGACT TTGTAAAATT AGTTTCTAAA GATGATGGGA AGACATTTTA TAAACAAGAG 
ATTGTTAAAC ATGATGACGT CCCACACGGT TTAATGATGA AAATTCACGA CATGCATATG 
AATTAATAAA AAAGCATCTA TAACGTAATT TTGAAGAAGT AGAGTTATCT TCTTATGCGT 
TTTAGA 

(2) INFORiMATION FOR SEQ ID NO: 193: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1626 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNBSS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 133: 
GAGGTCTATA TACAATTATG GTTGTTCCAG TTAAACGAAC TGATGGCTTT ATTACTAAGT 
TTAATAGATT AATTGAAAGA CGATTATTAC GTCATTTCAG TAAAAAAGGT TATATCACAT 
GGGAGGAAAA TTGATTGTCT GACATTTTAA jfU^TGTATCGG TTGTGGTGCG CCACTTCAAT 
CTGAAGATAA AAATAAACCT GGTTTTGTAC CAGAGCATAA TATGTTTCGT GATGACGTGA 
TTTGCAGACG TTGTTTCCGC TTGAAAAATT ATAACGAATT CAAGATGTAG GATTAGAAAG 
TGAAGACTTT TTAAAATTAT TATCAGGACT TGCGGATAAA AAGGGTATTG TCGTCAATGT 
CGTGGATGTA TTTGACTTTG AAGGATCATT TATTAATGCA GTTAAACGTA TTGTCGGAAA 
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TCGAGTTAAA 


GAATGGTTAA 


AACGAACAGC 


AAGAAAATAT 


GGTTTGGAAG 


CTGACGATGT 


CGTATTAATT 


TCAGCTGAAA 


AAGGCTGGGG 


CATAGACGAC 


TTATTATCAT 


CAATTGCGAA 


TATTCGAGAA 


AATGAAGATG 


TGTATATTGT 


AGGGACAACG 


AATGTTGGGA 


AATCTACATT 


GATTAATAAA 


CTGATTGAAG 


CTAGTGTTGG 


TGAAAAAGAT 


GTAGTAACAA 


CTTCAAGATT 


CCCTGGAACA 


ACTTTAGATA 


TGATAGATAT 


TCCTTTAGAT 


GAAACATCAT 


TTATGTATGA 


TACACCAGGT 


ATTATTCAAG 


ATCACCAAAT 


GACGCATTTA 


GTTAGTGAAA 


AAGAATTGAA 


AATTATTATG 


CCTAAGAAAG 


AAATAAAACA 


ACGCGTATAT 


CAATTAAATG 


AGGCGCAGAC 


ATTATTCTTC 


GGCGGTCTAG 


CGCGCATAGA 


TTATGTATCA GGTGGTAAAC 


GTCCGTTAGT 


TTGTTTCTTT 


TCTAATGACT 


TGAATATACA 


TCGTACTAAm 


ACGGAGAAGG 


CTAATGATTT 


ATGGCGTAAT 


CAACTTGGCG 


ATTTATTAAC 


GCCACCTGGA 


AATCCACAAA 


ATTTTGATCT 


TAATGAGGTA 


AAGGCTGTTA 


GACTTGAAAC 


AGGCAAAGAG 


AAACGCGATG 


TTATGATCTC 


TGGTCTAGGC 


TTTATAACTA 


TAGGACCAGG 


GGCTAAAGTA 


ATCGTTCGTG 


TTCCTAAAAA 


TGTTGAJcGTT 


GTATTAAGAA 


ATTCTAl~i~x"i^ 


ATAAGGTGaT 


TAAAAAAATG 


AAATTTGcAG 


TTATAGGAAA 


TCCTATTTCA 


CATTCCTTGT 


CGCCCGTTAT 


GCATAGAGCA 


AATTTTAATT 


CTTTAGCATT 


AGATGATACT 


TATGAAGCTT 


TAAATATTtlC 


CAATTGAAGA 


TTTTCATTTA 


ATTAAAGAAA 


TTATTTCGAA 


AAAAGAATTa 


GAAGGCTTTA 


ATATCACAAT 


TCCTCATAAA 


GAACGTATCA 


TACCGTATTT 


AGATTATGTT 


GATGAACAAG 


CGATTAATGC 


AGGTGCAGTT 


AACACTGTTT 


uGATAAAAGA 


TGGCAAGTGG 


ATAGGGTATA 


ATACAGATGG 


TATTGGTTAT 


GTTAAAGGAT 


TGCACAGCGT 


TTAnCCAGAT 


TTAGAAAATG 


CATACATTTT 


AATTTTGGGC 



GCAGGT 

(2) 3NF0RMATI0N FOR SEQ ID NO: 194: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 635 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 194: 
AGGGTTAATT GTCGGTTTAA TTGCAATGAA TAAGTTCCAT GTATTAGCTG GCTATAGAGC 
GAAATTCATC TTAATGGTGA TTTTAACTAT GATGGTCTTC GTACTTATTA ATACGTATTT 
ACTAAGACAG GTAAAATCTA TCGGTATGTT CTTAATGATT GCTGCATTGG GTCTATACTT 
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GTCTTATATC GATAACATGT TCTTCAATTA TTTAAATGCA GAGCATCCTA TAGGCTTGGT 300 
GCTAGTAATA TTAACAGTAC TTGTGATTAT TGGCTTTGTA CTGAACATGT TTATAAAACA - 360 

CTTTAAGAAA GAGAGATTAA TCTAATGTTG ATGAATAGCG TGATTGCTTT AACTTTTTTA 420 

ACAGCATCTA GCAATAATGG CGGACTTAAT ATTGATGTGC AACAAGAAGA GGAAAAGCGA 480 

ATCAATAATG ATTTAAATCA ATATGATACA ACGCTATTTA ATAAAGACAG CAAAGCGGTT 540 

AATGATGCGA TTGCTAAGCA GAAAAAAGAA CGACAACAAC AAATAAAAAA TGATATGTTT 600 

CAAAATCAAG CGAGTCACTC GACTCGCTTG AATGA ^ 635 



(2) INFORMATION FOR SEQ ID NO: 195: 

75 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 13715 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

20 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 195: 

2S CTGAAATGGG TATTATTTGT CTTCTTCATC ATAAAGTAAT AAAGATTGTT CATCATTGCG 60 

ACGTTGCCAA TTTTCATTTG GCGATCTTGG AAOGTATAAT AATTGCCTAG TAGCATACGC 120 
TTTGATTGAA ACATACAAGT CATTCCTTGA ACTTGCACCT CAATTTCCAC ATTTGAATTT 130 

30 TCTTTTATAT TAATAATTTC ATCCAAATTC AGCTCACGTG CTAAGACAGC TCTTGATGCG 240 
CCTCTTTTAC CCCAGTAATT ACATTGAAAA TGATTAGTTA CTAACGTCTC TGCATTCCAA 300 
TGAAGTGGTA TTGGATTTTC TTGCGCCTTC ACATACATTA CTACTGCTGG ATCCCCGAAA 360 
ATAATTCTGT CAACTCGTAT TTCATGTAAA AAATTAATAT AATCTTCTAC AGCATCTAAA 420 
TGATAATTAT GAAATAATCC ATTCACTGCC GCATATACTT TTTTATCGTT TTTGTGAGCT 480 
AATGCGACAG CCTCTGTCAT TTGTTGTCTA TTGAATTCCC CTGGAAGTCT TAAACCAAAC 540 

40 

TTTTGCTCGC CAATTACAAA AGCATCTGCA CCTAAATCAA TAAGTGTTTC CATATGGCTT 600 
AATGACTTGG GTGTGACAAG TAATTCTGTC ATAGTCATTC TCCTTTAATT GAAATCGCTA 660 
ATCCATCGTC TATATTTAAA AAATTCGTTG TATATCCTGG TTGCTTTATT AACCACTCAT 720 

45 

TATAATCTTG AACCTTTTTA ACCATTTGTC TTACATTTCT CGATCTAACA ATCCCAATAT 780 
CCGATACAAA ACCGTGATAT AAAACATTAT CTGTAATTAC GAGACCTTGG TGCTTTAAAA 840 
SO GTGGTGTATA TATTTCAAAA AATTTCTTTG ATTGCGCTTT TGCTGCATCA ATAAATATCA 900 
TATCATAAAC TTTGTCATTT ACATTTTCAA ATTGCTCTAA AGCATTACCT TCAATAATTC 960 

55 . ■ . 



897 



CATTACGCTC TATCGTTGTG ACATGAATGT 
TATAGCCGAT TGCTGTACCA ATTTCTAAAA 
5 GCTTAATTAA ATCTAATGTT AAACGATCTA 

CACGCAAAAC TTCGATTGAA CTATTTTGAT 
TTAGGTCATC GATGTTTTAA ACTTCCTTTA 
AAAATAAATC AGCCTTCACA ATTGATTATA 
GTGTTAGACG CAAAGCTATT TTATTTATAG 
AGATATTTTA CCATATTTTC AATAAAATTA 

15 

TTAAAAAATA CTCTTGCCTC CCCATCTTTA 
TTCTTCCATT TCAGTATTTA CAACTTCTTC 
TGGTACTAAC TTACCACCGT CACCTGACTC 

20 

AATCATATCG TCTTCATCTG ATTGAGCACC 
GAATTCAGGA TGATAAAATT CTAAAACTTT 

25 GAATAAAGTT AATAATTCTT CTTCGTTATT 
AGTCATAGTA AAATCTCCTT TTAATGTAGT 
GCTGCCATTT TATCAATCAC TTGTTTTCTT 

30 GATCGTTCAG CAGCCATTGT GCTTAATCTT 
TAAGCTTCTA ATAATTTTTC TTTATATGTT 
TTATTCATGT TTTTAGGTAG TCCTATTACG 
TCTACTAATT GGTCAATACC TAATTCATTA 
CCTTGTGCCG TCCAACCCAT TATATCACTA 
TCGAGTCCTA AAATTTTATG TTGTAACATA 

40 

GAAACAAGCT CTTCCATAAT AACATCTCTA 

TTTTGGCGTG GAATATACGC AGGGTCACCT 
GCATTATATC CTCGTTCATC TAATGTTCGA 

45 

TGCGTTGGAA GTTCTTCATA GTCGAATTTC 
ACTCCTTTAA TTACAAATAT AACTCACTAT 
GATTTTTAAT GTAATCTTTA ATAAAGCTTA 
CGCCACCTTG AGCCATATCT GGACGACCGC 
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CATCAGATAT AGAAGCGAAT TGCATAGAAC 1080 

TATTTTTAAC ATTATTCATA CGAATTAATT 1140 

CAATTGGCAC TTCATTTACC TCGGCAAATT 1200 

GTTGATGTAA ATCTATTAAA TATTTTTTAT 1260 

TGTAAAATAA GTCAATATGA TTATGACAAT 1320 

ATTTTGCCAA CCAATTAAAT GACTGATTTC 1380 

AAGCGAATCA TTCATATAAA ATTTAACTTT 1440 

TAAGCGTTAA TTATTTATAG ATTGCTTGAC 1500 

AGGTTAGCAA GAGTAAAATC TTTTTAATTA 1560 

AATCATGTCC CATTCTTCAT CAGTTTCGAT 1620 

ATCTGGTTCA TTGATCATTG GTACAAGCTC 1680 

TTCTTCAGCT AAGATAACAT ACTCTTTTTT 1740 

TCSGTATAAA ACTTCATTTC CCTCTTCATC 1800 

AATTTCTAGT TGTGAATCAT GATTATGTTC 1360 

GAATCTAAAT AGCCTTGTAA AATAAATACC 1920 

TTTTGTCTTG AAACATCTGC TTCTAATAAT 1930 

TCATCCCACA TCACAATCTC AATAGAAGGA 2040 

AACGAAGCTT CGCCTCGAAA TCCTATTGAA 2100 

ACTGTACCCA CATTATGTTT TTTAATAATG 2160 

TTTTCTTCAT TGATTCGGAG TGTGTCTAAT 2220 

ATTGCAATTC CTACCGTTCT ACTACCGACA 2230 

AATTATTTAT TTTGCTCTTT TAAATAGTAA 2340 

TCAATATGAC GAATTTGATT TCTTGCTTCA 2400 

GATAATAAAT AACCTACAAT TTGGTTTACG 2460 

TAAACATTAT TTAAAACATC TCTTACATCT 2520 

ATTGTTTTAT CAAAGTTTTC CATTTGCGAC 2580 

CATCATACAA TATTATGGCT TTAAATTATA 2640 

ATGATTTTGA GATATTTTCA GGTTGTGTAC 2700 

CACCTTTACC ACCAACGATT GGTGCCATTT ' '2760 
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TCGATACTTT ATCATCAACA TTACTTGCAA GAATGATAAT TGTATCTTGT AGTTTAGATT 2880 

TAAAATCGTC CATTGTCGAG CGAATTGCTT TCGCATTTGG TACATCCACT TCAGTAACCA 2940 

5 ATACTTTATA GCCATTGATT TCTTCAACTT GATCTTCAAT ATTACCCATT TTAAGTGATG 30 00 

TGATTTCTTT GTCACGTTGC TCTAATTGTT TTAATAATGC TTTTTCTTCA TCTTGTAATT 3060 

GTGTTAACTT ATCGACTACT TGATCATCAG ATTTCACTTT CAGCTGTGAT TTCATCGTAT 3120 

TAAATTTCTC TTGAATATCT TCTAAATATA AGAAAGCTGC TTTACCTGTT AATGCTTCAA 3180 

TACGACX5CAC ACCAGCTCCT GTACCTGACT CACTTACTAT TTTGAATAAG CCAATTTCAG 3240 

AAGTATTGCG GACATGAATA CCACCACATA ATTCAATTGA AAATGGTGCC ATATTTACTA 33 00 

75 

CACGCACAAC ATCACCATAT TTTTCACCGA ATAATGCCAT TGCGCCCATT TCTTTAGcTG 3360 

AAGCAATATC CATTTCTTGA ATGTTAACGT CAATACCTTT CCAAATTTCT TCATTTACTA 3420 

AGCGTTCAAC TTGATCAATT TCATCATTAG TCATTGGACC AAAATGAGAG AAATCAAAAC 3480 

20 

GTAAACGATC TGCTTCTACT AGTGAACCAG CTTGGTTAAC ATGATGACCC AGTACTGATX 3540 

TCAACGCTGC ATGTAATAAA TGTGTTGCAC TATGGTTCTT TTGAATGTCA CGTCGATCAT 3600 

TTTGGTTCAC TTCAGCAGAC ACTGTAGCGC CAACATTTAC TTGGCCAAAT TGTACTACTC 3650 

25 

CTTTATGCAA GTTTTGACCA TTTGGTGCTT TGGTTACTTC ACTAACAGCA ATTTCAAAAT 3720 

TGTCATTATA AACAATACCT GTATCCGCAA CTTGTCCACC ACTGATTGCA TAAAATGGTG 3780 

30 TTTCCGTTAA CATGAAGTAT ACTGTTTCAC CCGCTTCAAC TTGTGAAACT TCTTCACCAT 3840 

TGTATATCAA GTGTGTTAGT GTTGTTTGAG ctGTCGCAGT ATCATAACCA ACAAAAGTAC 3 900 

TTGCAGATGT AATATTTTTC AATACTTCAC TTTGAACTTG CATTGATTGA GAATTTTGAC 3960 

GTGCTTGACG TGCACGATCA CGTTGTTGTT GCATTTCTGA CTCGAATGTT GTCATATCAA 4020 

CTTC^IAATCC TGCTTGCACT GCTATTTCTT CAOTTAATTC AATTGGGAAC CCATACGTA7 4080 

CATACAATTT AAATGCATCT TTCCCATTAA TTTCATTTGT TGTCGCTTTA GCTTTTTTAA 4140 

40 

TTAATTCATT TAAAATCGCT AAACCATCTT CTAATGTTTC ATGGAATCGT TCTTCTTCAG 4200 

ACTTTATAAC ACGCTTAATG AAATCTGCTT TTTCCTTAAC ATTTGGATAA TATGGTTCCA 4260 

TAATGTCTGC AACAATATCA ACAAGTTTGT ACATAAATGG CTCATTGATT CCTAACGTTT 4320 

45 

GACTAAAACG AACGGCACGA CGTAACAATC GACGTAATAC ATACCCTCTA CCTTCATTGG 4330 

CAGGTAATGC ACCATCAGAA ATTGCAAATG CAATCGTACG AATGTGGTCA GCAATTACTT 4440 

TAAATGCCAC ATCTTGTTCG TTGTTTACTA AATATTGTTT ACCTGATACT TTTTCGATTT 45 00 

CATTCATTAT AGGCATAAAT AAATCTGTTT CATAGTTAGT ACGTACATTT TGAGAAACTG 4560 

55 
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TATGATCTTT ATTATGATTG AATTCACTAA 
CATTTTCTCC ACCTGGATAC ATTTCTTCTG 
5 GATCATAGAA AATCTCAGTG TTCGGTCCTG 

CTTCAATGCG AATAATACGA CTTTCTTCAA 
CTTCCATATC TTCCGGATGA ATCGTAACGT 

10 

TATCACTCGT TAAAAATTCG CAAGCAAATT 
TTGAGAAGTT ACCTAACATT TCAAAGAATG 
CAATATCATT TGTACGAATA GCTTTTTGAG 

75 

CACGTCCATC AAAATATTTC TTTAATGTTG 
CATCATCAAT TGGCACTAAT GGTGCAGAAG 
AATCTAGATA TTTTTGTCTA ATTTCACTCG 

20 

ATTTACTGTT TTTAAATTAC CATTCCATAA 
AACTAGTATA AATCAATATC ATTTTTTATT 

25 AGGGACGAAC GTTATCGCGG TACCACCCTA 

TTTAATTCGA CTATACAGTT GTGCATAAAG 
ACCAACCAGT ACATCTCTGA TAAACAAATC 

30 TCTATTTTAG TTACATTTAC GCTTGTTGTC 

CTCCCATATT AATCATTGGG TCAATTTTAA 
CTGTTTTTGT TGAATCAGAC ATAACTTCTT 

35 

CTTGATCATC TATTGTCGTT TGTGAAGCTC 

tttcStcatc ttctgaatta aaataatttt 
cttgaccatt tgtntcaat ccaatatcaa 

40 

TCGTTTTCGC TCTAGTTAAA CCAGTATATA 
GTTTAACAAT AGGCATGATA ACAATAGGAA 
TACAATAAGC ATGTGTTAAT TCCATCATAT 

45 

CAAAATCCAC AACAAGTACA TCTTTATTAA 
CAATAACTCC TATGTCACCA TTGAATATGT 
SO CTTTGTCACC TTTTCTAAAG ACTACATCAC 
TAGGGTTTAA AATATCTTGT AAAACTTGAT 

55 



ATACTAAGTT 


CCATACTTCA AGATAGCGTT 


4$80 


CCGGATCGTC 


TTGTCCATAT 


GCTTCTCCGC 


4740 


AAGGCCCTTC 


ACCAATATCC 


CAGAAGTTAC 


4300 


GCCCAATATC 


TTTATGCCAA 


ATGTTGTATG 


4860 


ACAA'n-i'ATC 


TGGCTCCATA 


CCCATCCATT 


4920 


CAATCGCTTC 


TTGTTTAAAA 


TAATCACCAA 


4930 


TATGGTGACG 


CGCTGTGAAA 


CCAACATTTT 


5040 


AGTTTACAAT 


TCTTGGCTTT 


TTAGGTGTTt 


5100 


CTACACCTGA ATTAATCCAT 


AATAATGTAT 


5160 


GTTCAACCAT 


ATGTCCTTTT 


TCAACAAAGA 


5220 


CTTTTAACTT 


TTTCATCATT 


TACACATCCT 


52B0 


AAATTGATGA 


CACAGATAGT 


CGATTTGCAA 


5340 


ATTAAAAAAT 


AAAAAACGCC 


CATCCTCAAA 


5400 


GTTATAAATG 


CAATTCAACA 


CATTTATCAC 


5460 


TAGCGTTCAC 


TAATGTTTGT 


tGTACTTTTC 


5520 


aTTAACTACT 


CATCTTTATA 


CGAATTTAAT 


5580 


AACGTTCTAT 


AAAGTCATAC 


GGCGTGATTT 


5640 


ACATTGTAGC 


TTCCGTTAAT 


ACATTTGTAT 


5700 


CACTATCATT 


CGATGACATT 


GGCGCTTCTA 


5760 


CTGTATCATT AgTTGCTGTG TTTTCCAgCA 


5320 


XCAACAATGT 


ACATAATTGT 


GTTAAACGCG 


5880 


ATGCTTCCGG 


ATCACCAAGT 


AAAACTAAAC 


5940 


ATATCGGTCT 


TTGTAACATT 


CTAAAATACT 


6000 


ATTCTGAACC 


TTGTGATTTA 


TGGATTGATG 


6060 


CTTGTTTCGT 


AAATGTAATT 


TCATTACCTT 


6X20 


GGGCATTTTC 


TTTCGCCCAA 


AAAATACCAA 


6180 


TATCATTTGa 


CCTATTAACA 


AGTTGTAATA 


6240 


CAAACTCAAT 


TTCTCGTGTG 


TCTTTCTTTT 


6300 


TTAAACGTTT 


AATACCGGCA 


TTTCCTTTAT 


6360 
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CTACCTTCTC AACAACTGTT GGTATTTGGT TTGCCTGACA GTTAATAAAA CTTCTATCAT 64 80 

GAAAACGCTG TGTAATATCA ATTTTCTGAC CCAACTTCAT TCGATGTGCT AATTCTATAA 6540 

TGCTTGAACC ATCTTGTTGA CGATATACTT CAGTCAGATT TACTCGTGGT ATAGCTTTCG 6600 

ATTCAATTAA ATCTTTAAAT ACTTGACCAG GACCTACAGA AGGCAATTGG TCCTCATCAC 6660 

CTACAAATAT CAATTGTGCA TCTAAAGGAA CTGCACTTAA AAATTGGTGG AACAACCAAG 6720 

TATCTACCAT AGACATCTCA TCAATGATTA TGAGTCGTGC GTTTATTTCA TTTTCTAATA 6780 

TATCCTCTGG CTTTGTGTCT TGATTCCAAC CTATTAAACG ATGAATCGTC ATTGCTTCTA 6940 

ATCCAGTTGA CTCTTGTAGT CTCTTAGACG CTCTTCCTGT TGGCGCTGCT AATACAACTG 6900 

GATAATCATC ATTGACATAA TCATCATAAT CTAATGATAA GCCATGAATC TCAGCATATA 6960 

ATTCAACAAT ACCTTTAATT ACTGTCGTTT TTCCTGTTCC CGGTCCACCG GTTAATAGCA 7020 

TCACCTTAGA ATTGATAGCC GTTTGCAAAG CTTCTTTTTG TGAAGCTGCA TAGTTCACTT 7080 

GATTCGCATC TTCTATTTCA CCAATATGCA TTTGTAAATC TGACTGTTCA ATTTCTGTAA 7140 

' GTTTATTrGT ATGCGTCTTr ATTCTGAATA AGTTTTGAAC ACTTTTGATT TCaGAATAAT 7200 

25 ACAAACTTGG AATTGCAACT TGTTCaTTGT CAATAATTAG TCGTTTTTCC TCATTTAAGT 7260 

ATTGCAACAT TTCGTCTAAT TTTTCAGGTT CGATGACCTC TTCATCTTGa TAATTTAATA 7320 

CATCAACCGT TAAATCTATA ACAACATTGA TAGGCAAATA TGTATGTCCC TGTTTAATAC 73 BO 

30 ATTCTTCTTC TAACGTATAG AGCAACGCAG CTTTTAATCG TTCATTATCG TTATAAGCGA 7440 

TACCAATATT TCTAGCAAGT TGATCTGCTT TATTAAAACC AATACCTTTA ATATCATAAA 7500 

TCAATTGATA TGGATTTCGA TCTAAAATAG TCAGTGTATC GCCGAGATAA AACTGATAAA 7560 

TTGCCATTGA AAGTTTAGGA CCAAACCCTA AATCATGTAA ACGAATCATT ATTTTTTCAG 7620 

ATTC3TGATT TGCTGAAATT TGTTCTGCAA TTTGTTTCTG TTTCTTTTTA GATAATCCCG 7680 

AAAdTTTTTC TAGCACTGAA TGGTCATCTA ATATATCATT TATCGCATTG TCACCTAATG 7740 

TATTAACAAT ATTTTGAGCT GTCTTTTTAC CTACACCTTT AAACAAATCA CTAGATAAAT 7800 

AACTTATAAT TGCTTCTTTC GTTTGTGGCA TTTCTTTTTC AAAAGTCTCT GCTTTTAATT 7860 

GTTTACCATA ACGTGGATGA TCAACAACTT GCCCTTTAAA TGTGTAGACA TCGCCTTCAA 7920 

• CAATATTCGG AAGAAACCCT ACAACAGTTG GCATTGTATC AAAGTCTTCA TTTGTTTCAA 7980 

TAGTATCTAC TTTAAGCACT GTATAAAAAT TATCACTGTT TTGAAACAAT ATCGCTTCAA 8040 

SQ CAGTACCTTT GATCATTGAA TAATCAAATA GTGTAGGGTC TGACATGTTA CTCCTCCTCT 8100 

TTCATTTTAG TGAATGTTTT CAGCGCATGC TGACTTAATA AGTGTTTAGG GTCGATAGTC 8160 
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70 



75 



20 



AAGCCCAAAT TGTATCTTGC ATCAACATGA TTTTTATCAA TCGTTAATAC ATGTTTAAGT 3280 

TGAGTTATGG CTTCATTAAA CATTTCTAAT TGACATAATA CAAGACCATA TTGAAATTGA 8340 

ACTTCTGCAT CTTTGTCTTT ATCTAGTTCC GCAGCAGTCA TTAAATACGG CAATGCCAAG 8400 

CTTAAATGAT TCTAACTGAT TAAACGCCAT ACCGATCATA TAATTACAAT CAACTTGTTC 8460 

AATCTCTGTT TGTAATGCTT GTTGATATAA TTTAATAGCT TCTTGATAAC GTTGCTGATT 8520 

ATAATATACA TTTGCTAGAT TAAAAAATAC GACGCCATTC TTCGGATCTA TTGTnAAAGC 8580 

TTTTTGGAAA AAACGCTCTG CCTTTyCAAy CyCATTCgCA TCAGCAAGTA CGATniCCaGC 8640 

ATTAATATAA TTTTCAATAA TTGTAGGATT TTCTTCGATA TTTCCGAACA ATGCTTGTAA 87 GO 

OGCTTCTTCT ATTTTTCCAT TTTGTATGTA TTGATAAATT GTTTGTTGAT CTATCATTTA 8760 

CGAACCTCAT TTCTCATCAA TTATAACATC TTGATAAATT GTATGTCTCG AATCACTTAA 8820 

CAACGAATAA AATATAATCT AATATCATCT TCATTCATGA AAAAGCGGGA ATGGAATAGA 8880 

AATGCTTAAG AACCATTAAC GGTTTATTAT GTAATGGTTC TTCCACATTA GCCACCACTA 8940 

TTATGTACTT AAAAATAAGA ATACATAATT AGATTCATGC ATAGGGAGTG GGACAGAAAT 9000 

2S GATATTTTAA CAAAATTAAA TTCGTTATCC CCAACTGGCA TTGCCTGTAG AATTTCTTTA 9060 

CGAAATTCTC TATGTTGTGG TCCCGCCAAT ATAACATTGT AGAGCCTAGG ACATTGTGAT 9120 

GTCCCAGACT CTATCCTCAT GAATTATTCT CATCAAAAAC TGTCTTTCGT CATTTTCAAC 9180 

30 GTTGAAACTT CAAATAAGTA ATTTATTGTT GCCATTGTTT ATACAACATA ATTTAATTGA 9240 

CCTTCATTTT TGAACACATC GTCAATTGTT GCACCACCAA GACACACATC ACCTTGATAA 9300 

AAAACAACTG CTTGTCCAGG TGTGATTGCT CTTACTGGCT CAGCAAAAGT AACACGTAGg 9360 

CAtGGtCGTT TTCACGTTTC ACAAAAACTT TCGTATCTTT TTGGOGATAT CTAAATTTAG 9420 

CTGtACATTC AAAACCTTGA TCTAAGTCAT TATCTTCTGG ATTTACAAAT GAATAGTCTG 9480 

AAGCAATTAA GTAATCACTG TATAATGCAT CGTGATGGAA TCCTTGTTCT ACATATAAAA 9540 

CATTATCTTT TAGGTTTTTA CCGACAACAA ACCAAGGATC GCCATCTCCA CCTATACCTA 9600 

ATCCATGTCT TTGTCCTATT GTGTAATACA TCAAACCACT ATGTTTACCC ATTTTCTTAC 9660 

CATCAAGTGT TATCATATCA CCCGGTTGTG CAGGTAAATA TTGTGATAAA AATGTTTTAA 9720 

AGTTTTTTTC GCCGATAAAA CAAATGCCTG TAGAATCTTT TTTCTTAGCA GTAACAAGTC 9780 

CTTGTTCTTC AGCAATTCGA CGCACTTCAC TCTTTTCGAT GTCGCCAATT GGGaACATCA 9840 

SO CTTTTGAAAG TTGTTGTTGA GATAATTGAT TCAAGAAGTA TGTTTGATCT TTATTATTAT 9900 

CTACACCACG TAACATTTCA ACATGACCAT CTTCATGACG ATGTATGCGT GCGTAATGTC 9960 
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25 



30 



35 



40 



45 



SO 



TTTCTTTATT ACACATAACG TCTGGATTTG GAGTACGACC TTTTTTGTAT TCATCTAAGA 10080 

AATACGTAAA GACTTTATCC CAATATTCTT TTTCAAAATT AACAGCGTAA TACGCAATGC 10140 

CAATTTGATT ACACACTTCA ATAACATCGT TGTAATCTTC AGTTGCAGTA CATACGCCAT 10200 

TTTCGTCAGT GTCATCCCAG TTTTTCATAA ATATGCCAAT GACATCATAA CCTTGTTCTT 10260 

TTAAGACGTG GGCTGTTACA GAACTATCTA CACCGCCTGA CATACCAACG ACAACACGTA 10320 

TATCTTTATT TGACAATTAT GACTCCTCCT TAAATTTAAA ATATATTTTA TGAATTTCAG 10380 

CTACAATTGC ATTAATTTCA TTTTCAGTAG TCAATTCGTT AAAACTAAAT CGAATCGAAT 10440 

GATTTGATCG CTCCTCATCT TCGAACATTG CATCTAAAAC ATGCGACGGT TGTGTAGAGC 10500 

CTGCTGTACA TGCAGATCCA GACGACACAT AGATTTGTGC CATATCCAAC AATGTTAACA 10560 

TCGTTTCAAC TTCAACAAAC GGAAAATATA GATTTACAAT ATGGCCTGTA GCATCCGTCA 10620 

TTGAACCATT TAATTCAAAT GGAATCGCTC TTTCTTGTAA TTTAACTAAA AATTGTTCTT 10680 

TTAAATTCAT TAAATGAATA TTGTTATCGT CTCGATTCTT TTCTGCTAAT TGTAATGCTT 10740 

TAGCCATCCC AACAATTTGC GCAAGATTTT CAGTGCCTGC ACGGCGTTTC AATTCTTGTT 10300 

CACCGCCAAG TTGAGGATAA TCTAGTOTAA CATGGTCTTT AACTAGTAAT GCACCGACAC 10860 

CTTTTGGTCC GCCAAACTTA TGAGCAGTAA TACTCATTGC GTCGATCTCA AATTCGTCAA 10920 

ACTTAACATC AAGATGTCCA ATTGCTTGAA CCGCATCAAC ATGGAAATAT GCATTTGTCT 10980 

CAGCAATAAT ATCTTGAATA TCATAAATTT GTtGCACTGT GCCAaCTTCA TTATTTACAA 11040 

ACATraTAGa TACTAAAATC GTCTTATCTG tAATTGTTTC TTCAAGTTGA TCTAAATCAA 11100 

TAGCACCTGT ATCATCAACA TCTAGATATG TTACATCAAA ACCTTCTCGC TCTAATTGTT 11160 

CAAAAACATG TAACACAGAA TGATGTTCAA TCTTCGATGT GATAATGTGA TTACCCAATT 11220 

GTTC&TTTGC TTTTACTATG CCTTTAATTG CCGTATTATT CGATTCTGTT GCGCCACTCG 11280 

TAAATATAAT TTCATGTGTA TCTGCACCAA GTAATTGTGC AATTTGACGT CTTGACTCAT 11340 

CTAAATATTT ACGCGCATCT CTTCCCTTAG CATGTATTGA TGATGGATTA CCATAA7GCG 11400 

AATTGTAAAT CGTCATCATC GCATCTACTA CTTCAGGTTT TACTGGTGTG GTCGCAGCAT 11460 

AATCTGCATA AATTTCCATG TTTGGACACT CCTCACAATT TTATCAATGT TCCAATAATA 11520 

GCACCTTACA TACTATTTTT CTACTTTTCT GTTTAACTTT ATTTATAATG TTTTTAATTA 11530 

TATTTTACCA TTTTCTACAC ATGCTTTTCG ATAGGCTTTT TTAAGTTTAT CGCTTTATTC 11640 

TTGTCTTTTT TATAAATTTT AGTATTTGCA GATATTTTTT TATTTGTAAA ATGTAACGTA 11700 

CTATTATTTT GGTTATGAGC AATTTAATAT TTATCTGGTT ATTCGATTGG TATACTTCTT 11760 
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GTCCCTATTC GAGAAGGTGA AGATGAACAA ACAGCAATTA ATAATATGGT TAATCTCGCA 11880 

CAACATTTAG ACGAATTATC ATATGAAAGA TATTGGATTG CTGAACACCA TAACGCTCCC 11940 

AACCTAGTAA GTTCAGCAAC TGCTTTATTA ATTCAACATA CGTTAGAACA TACGAAACAC 12000 

ATACGTGTAG GTTCTGGAGG CATCATGTTA CCTAATCATG CTCCATTAAT CGTTGCGGAA 12060 

CAATTTGGCA CGATGGCAAC ATTATTTCCA AATCGTGTCG ATTTAGGATT AGGACGTGCA 12120 

CCTGGAACAG ATATGATGAC CGcAAGTGCA TTAAGACGAG ATCAACATGA TGGTGTTTAT 12180 

AAATTTCCAG AAGAGGTTTC ATTATTACAA CAATATTTCG GCCCTGCTCA CCAACAAGCA 12240 

TATGTTCGTG CTTATCCAGC AGTAGGTAAA AATGTGCCTT TATACATTCT TGGTTCITCA 12300 

ACAGATTCTG CACATTTAGC TGCTCGCAAA GGGCTTCCAT ATGTGTTCGC TGGACATTTT 12360 

GCACCTCAAC AAATGAAAGA AGCTATCGAA ATTTACAAAA CGTTATTTGA ACCTTCTGAT 12420 

GTATTAGACG AACCTTATGT TATTGTATGT TTAAATACAA TCGTTGCTGA AAATGATGAC 12480 

GAAGCACAAT ATTTAGCTTC ATCTATGGCA CAAGTAATGG TTAGTATCAC TCGTGGCAGA 12540 

ATGCAGCCCG TTCAACCGCC AACACATGAA CTACAAAATA TATTAACGCC GAGAGAATAC 12S00 

GCGATGGCTA TGGAAAGACA GAAAATATCA TTAATAGGTT CAGAAAATAC TGTTCAACAA 12660 

AAAATTCAAG ATTTTATGGA AACTTATGGT GAAGTCAACG AAATTATGGC AATAAGTTAT 12720 

ATTTATGATA AAGATATGCA ATTAGACTCT TATCGTCGGT TCAAGAATGT TATAAATCAG 12780 

ATAAATGAAA AAAACACTTT ATAATGTGAT AAATAAACTA AGTGAAAGTA TGTATCCATA 12340 

ATATTAATAA AAATATACAG TAACAGCATT TTGAATGAAA GATGTCTTTA TTGTTGAATC 12900 

ATTTATTTTA GTAATGATTC AAATTCACTT AAAATyCTAA tGCAAATATG AAAGCGCCCC 12960 

TTCAcTTTAC ACTGTGTAAG TGTTTATTTG ATGGGGCGCT TTCAAAATAT TGAAAAGCAT 13020 

ATCCfiAAATT TAAAGAAATT TATTTCTCTT TATCTTCATT TTCTTTTTTC TCTTCGTTAT 13080 

TCGATCCTGT ATATTCATTT ATCTTATCTT TTACATTTTT AACTTGTTCA TTATCGCTAT 13140 

TTTTAAATTT TTCTACGCGT CTTTAGCTTT ATCCATAAAA CTCATATTAA TCGCTCCTCT 13200 

TATATTTGAT TAGTTTAATT GAACTTATTT TTTAAGTTTA TCAATTGCAT CAG|TTATTTT 13260 

GTTTTTAGCA TTTTCAACAA CTTCTTTTGC TTTaCCAGTC GCTTTATCTT GCTGACCTTC 13320 

TTTTTCTAAT TCTTTGTTAT CAGTAACGTT ACCTACTGTT TCTTTAACAT TTCCTTTAAA 13380 

TTGATCGAAC TtACTTTCGT CTGCCATAGT GAAACCTCCT TGGATGTATA TATTTATATA 13440 

CCACTAAGGA GGTTCGCTmm mCAyymyAAT ATGAAGTTTT TATGTTATAG TATAGTATTT 13500 

ATACGATTAA ATATAAAACA TGTATCCGTC TAAATCTTCA CTTGTATCTA CATATTCCGC 13560 
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TAGTTGTTTT TGCGCAGGTG GTTCTGATTC AATACTTTCA ACAAATGTAA TTGGACCTTC 
TAACAGTCTT ATAATATCCC CTGCTGAGAT TTCTT 
(2) INFORMATION FOR SEQ ID NO: 196: 

4 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 873 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNSSS : double 

(D) TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 196: 
AAATCCATAA TGTCATGATA ATCTGCATAT GCTTCATATA ATTCAATCAT TGTGAATTCA 
GGGTTATGTC TAGTTGATAC ACCTTCATTA CGGAATACTC TACCAATTTC ATATACTTTT 
TCAAGTCCAC CGACAATTAm ACGTTTTAAA TGCAACyCAA TAGCAATACG CATGTATAaC 
GTTGCATCTA ATGCATTATG ATGTGTTACA AATGGTCTAG CAGCTGCTCC ACCAGCAATT 
TGGTGCATCA TAGGTGTTTC TACTTCCAAG AAACCTTTAT TATTTAAATA ATTACGCATT 
TCTTGAATGA TTTTACTACG ATTAATAAAT GTACGAGTGC TATCTTCGTT CGTAATTAAA 
TCTAAATATC TTTGACGATA tCTCTGTTCA ATATCCTGTA AACCGTGGAA TTTATCCGGT 
AATGGTCGCA ATGATTTAGT TAGTAGCGTG AATTTCTTCG CTTTAACCGA TAATTCGCCA 
GTATTTGTTT TGAACATTAC ACCTTCAACA CCAACGATAT CGCCTAAATC AGCATTTTTC 
CATAAATCAA ATTCGTCATC GCCAACTTGA TCTTTACGAA CGTAAATTTG AATTTGTCCA 
GCTAAGTCCT GAACGTGTGC AAATCCTGCT TTACCTTTAC CACGCTTAGT CATTAATCGT 
CCAGCTATAG CGACATGACT ATCCGCTTCT TTTTCTACCA ATTCTTCTTT AGAATACTGG 
TCCtS^CTCTT CTTTCAAATC ACTAGATAAA CCTGAACGGT CAAATTTAGA ACCAAACGGO 
TCTATACCAA GATCATATAA TTCTTGTAAT TtTTGACGTC GAACCAACAT TTGGTCATTC 
ATTTCTTCTG ACATAACTtT CTCTCCTTTA ACT 
(2) INFORMATION FOR SEQ ID NO: 197: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 452 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNSSS: double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 197: 
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ACCATAATAT GAATGGCTTC AGGATCAAAA TAAAGACCAA CTTCACTGCC TACTTCAGCT 
TTTTTAGTCG TTTGTATTAC CCATTCATAA CCTTTATTGT CTATACAACA TATTTCATAG 
TGGACCCCTC TAAATAACAT AGAATCAACA GTTGCTTTAA ATAATCCTTC TTCAGCTTTG 
ATTAATGATA TATCTTCTGG TCGAATAACG ACTTCTACTT TTTTATTTTC AGGAATACCC 
ATATCGACAC ATTCGAAATC TTGCCCATAA ATATTCACGA CATAATCTCT AACCATGCGC 
CCTTCAACAA rATTAGATTC TCCAATAAAA TCAGCTACAA ATCGATTCAC TGGTTCGTCA 
TaTATATCTG TTGGTGTGCC AAATTGTTGA AT 
(2) INFORMATION FOR SEQ ID NO: 193: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2308 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 198: 



TAGGTTGGGT 


TCTAACATAC 


GATAAAGCTC 


AACAAATCAA 


CACAGCTTTC 


TTTGTAAAAT 


TGTTTAATAC 


TGCATTAGCA 


GAACGTGATT 


ATTATTTTAA 


TATAGATGGA 


ACAAATGCTT 


TTAGATTATT 


TAATGCTGAA 


GGTGATGGTG 


TTGGGGGATT 


AACAATCGAC 


AATTACGATG 


GTCATTTGTT 


GATTCAATGG 


TACTCAAAAG 


GTATTTATAA 


ATTTAAATAT 


GCCATTCTTG 


AAGCGGTTAG 


AAAAGTATTT 


GATTATAAAT 


CTATTTACGA 


AAAAGTAAGA 


TTTAAAGACA 


GCGAATATAG 


TGGTGGTTTT 


GTTGAAGGAG 


ATGCACCTGa 


GTTTCCAATT 


GTTATCGAAG 


AAAACTTCAC 


ATTTTATAAT 


GTAGACCTTG 


AAGATGGTTT 


GATGACAGGT 


ATCTTTTTAG 


ATOSAAAAGA 


AGTGCGCAAG 


AaATTAAGGG 


ATCAATATGC 


CAAAGAACGC 


CATGTTTTAA 


• 

ACTTATTTAG 


TTATACAGGT 


GCTTTTTCTG 


CAATAGCAGC 


AAGTGAGGCA 


TCTTCAACAA 


CAAGTGTAGA . 


TTTGGCTAAT 


CGTTCTCGTA 


GTTTAACTGA 


AGAAAAl-rrT 


GGATTAAATG 


CTATTGATCC 


TAAATCCCAA 


TATATTTATG 


TCATGGACAC 


TTTTGATTTC 


TATAAATATG 


CTGCACGACA 


TGGACATAGT 


TATGACACGA 


TCGTGATTGA 


TCCACCXAGC 


TTTGCGCGTA 


ACAAAAAACG 


TACATTTTCA 


GTGCAAAAAG 


ATTATGACAA 


ATTAATTAAT 


GGCGCCTTAA 


ATATCTTATC 


ATCTGAAGGA 


ACATTATTGT 


TATGTACAAA 


CGCAAGTGTA 


TATCCATTAA 


AGCAATTTAA 


AAATACTATT 


AAAAAGACGC 


TTGAAGAGAG 


TGGCGTTGAT 


TATGAATTAA 


CTGAAGTTAT 


GGGATTACCA 


AAAGArrnA 


AAACGCATCC 


ACATTATAAG 


CCATCTAAAT 
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TATTGAGAAA AAGAAGGGTG ATAATATTAT GGGATTCAAA AACAATTTAA CATCAAATTT 
AACAAATAAA ATCGGTAATT CAGTCTTTAA AATAGAAAAT GTTGACGGAA AAGGTGCAAT 
GCCAACGACG ATTCAAGAAT TGAGAGAAAG ACGACAACGT GCTGAAGCAA TTGTAAAGAG 
AAAGTCTTTA ATGTCATCAA CAATGAGCGT TGTTCCAATT CCGGGTTTAG ATTTTGGTGT 
TGATTTAAAA TTAATGAAAG ATATTATCGA AGATGTTAAT AAAATTTATG GTITAGATCA 
TAAGCAAGTT AATAGCCTTG GGGATGATGT GAAAGAAAGA ATTATGTCTG CAGCAGCAAT 
TCAAGGTAGT CAATTTATTG GTAAAAGAAT TTCAAATGCA TTTTTAAAAA TTGTAATTAG 
AGATGTAGCT AAACGTACTG CTGCAAAACa AACAAAATGG TTTCCTGTTG TAGGACAAGC 
TGTGTCTGCA TCTATTAGTT ACTATTTTAT GAATAAAATT GGAAAAGATC ACATTCAAAA 
ATGCGAAAAT GTTATTAAAA ATGTCATGTA GGTGCTATAA TAGTTTTGCA ATTTGCAAAT 
TTTACTGAAA CCGGTTTTAA ACGAATTGAA TTTAAAGcAT GGTTTTGGTA AAGTTAATGT 
ATAAAACTAA GTTAGyATTG TAATAATATk GAAGATTCTA ACTATACGAA GGAGAAATGT 
AATTATGGAA CAAAATTCAT ATGTAATCAT CGACGAGAxnT GGTATTCACG CTAGACCAGC 
AACAATGTTA GTACAAACAG CTTCAAAATT CGATTCTGAT ATTCAATTAG AATATAACGG 
TAAGAAAGTA AACTTAAAAT CAATCATGGG TGTTATGAGC CTTGGTGTTG GTAAAGATGC 
TGAAATTACA ATTTATGCTG ACGGTAGTGA TGAATCTGAC GCCATTCAAG CAATCAGTGA 
CGTCTTATCA AAAGAAGGAT TGACTAAATA ATCATGTCTA AATTAATTAA AGGTATTGCC 
GCATCTGATG GTGTCGCAAT TGCTAAAGCT TATTTATTAG TTGAGCCAGA CTTAACATTC 
GACAAAAATG AAAAAGTCAC TGATGTTGAA GGAGAAGTTG CAAAGTTCAA- TAGCGCTATC 
GAAGCTTCTA AAGTTGAGTT AACTAAAATT AGAAATAATG CAGAGGTTCA ACTAGGTGCT 
GATi^GCTG CTATCTTTGA TGCAcaTTGG GGGGTGGTAG ATGACCCTGA ATTAATTCAA 
CCAATCCAAG ATAAGATTAA AAATGAAA 
(2) INFORMATION FOR SEQ ID NO: 199: 

(i) SEQUENCE CHARACTER I ST I CS : 

(A) LENGTH: 5559 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDBDNESS : doiible 

(D) TOPOLOGY: linear 



1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 
1920 
1980 
2040 
2100 
2160 
2220 
2230 
230a 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 199: 
AAGTAATAAA TCGTCTCATT TGGCAACTGA CGCATAATTT CTTTAGCTAC TGTCAAACCT 
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TTTAATTTTT AGTTTATCAT AACTAAGCAT TGGATTTTAG TATTATGCAC TGTGTTTACC 180 

ATTTTTGTCA TTATAATATT TATTTTAAAT CAGCCCACTA TCATATTGTC ATGTAATCTG 240 

CTTATTAAAA AAATCCCTTC CAAGTTATTG TGTATCTCCA TTCAATTTAA TTTTGAAAGG 300 

AACATAACwT TTTAACTCAA AAGGGATTAA TTTnTAnTCT ACTTCATGGT CTGAACCAAA 360 

GAATGATTTA AACATGTGGA ATGTTGTTTC TCTGTTCATT GCTGCAATGG ATGTTGTTAA 420 

TGGAATACCT TTAGGGCAAG CATTAACACA GTTTTGTGAA TTACCACACT GCTGTAAGCC 490 

ACCAGTACCC ATTAATGCAT TTAAACGTTC ATCTTTAGTC ATAGATCCTG TTGGGTGCAA 540 

ATTAAACAAA CGAACTTGCG AGATTGCTTG TGCACCAACG AaTTTATTAT TTTCAGTAAC 600 

ATTAGGACAA ACCTCTAAAC ATACACCACA TGTCATACAT TTAGATAATT- CATAAGCTGT 660 

TTGACGTTTT TTCTCTGGCA TACGTGGTCC CGGACCTAAA TCATACGTTC CATCAATTGG 720 

GATCCATGCT TTCATACGTT TTAAGTTATC GAACATTCTA GAACGATCAA CTTGTAAGTC 780 

ACGGATAACT GGGAAAGTAT TCATTGGCTC TAAACGAATA GGTTGTTCTA ATTGATCAAC 840 

AATCGCAGAA CAAGATTGTC TTGCACGACC ATTGATAACC ATAGAACATG CTCCACATAC 900 

TTCTTCTAAG CAGTTCATAT CCCAGACAAC AGGTGTTGTT TTTTCACCTT TAATATTAAC 9S0 

TGGGTTACGT CTAATTTCCA TTAAACAAGC AATGACGTTT AAATTTTCAC GATATGGAAT 1020 

TTCAAATGTT TCTTCATAAG GCTTAGAATC ACTTGTATCT TGTCGXrXAA TAATTAATTT 1080 

30 TACTGTTTTT TGTTTCGGTT TAGATTGTGT TTCATGTTGT GGAGTGTTTT TCACTGATTG 1140 

TTCAGTCATT ATTTTTTACC CCCTTTAGAC TTACTTGTGT AATCACGTTT ACGAGGTGGT 1200 

ATTAAACTCA CATCGACGTC ATCATAAGTA AACTGCGGTT TTTCAAATGC GCCTTGGAAT 1260 

GAGGCCATTG TCGTTTTTAA CCACTCTTCA TCATTACGCT CTGGGAATTC TGGTTTATAA 1320 

TGGGCACCGC GTGATTCGTT ACGGTTATAT GCACCAATCG TAATAACACG TGCAAGTACT 1380 

AACA^GTTCC ATAGTTGACG GGTAAAGAAT ACCGCTTGGT TACTCCAAGT TTGAGTATCT 1440 

TCCATATCAA TATCTTCATA ACGTTTCATC AATTCAACAA TCTTTTTATC TGTTTCTAAC 1500 

AGTTTTTCAT TTTCACGAAC AACAGTTACA TTTGCTGTCA TAATTTCACC AAGTTCACGG 1560 

TGTAATTTAT ATGCATTTTC TGTACCGCXJC ATAGCTAATA ATTTATCAAA ACGTTCTTGC 1620 

TCTTCAGCTT TACGCTTTTC AAAAATACTT TCGTCCATAT CAGTATATGA TCGATCAATA 1680 

TTTGAAATAT AATCAATCGC GTTTGGACCT GCTACTGTAC CACCATAAAT CGCTGATAAC 1740 

AATGAATTGG CACCTAAGCG GTTACCACCA TGTTGAGAGA AGTCACATTC TCCAGCTGCA 1800 

AATAACCCTT TAATATTTGT CATTTGATCA TAATCTACAT ATAGACCACC CATTGAATAG 1860 
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TAAATCTCAA TGATACCACC TAGTTTTACA TCTAACTCAT GTGGATCTTT ATGTGACAAA • 1980 

TCAAGATATA CCATGTTTTC GCCATTTATA CCTAATTTTT GGTTAATACA TACATCGAAA 2040 

5 ATTTCACGCG TTGCGATATC ACGAGGTACT AAGTTACCAT AATCAGGATA TTTCTCTTCT 2100 

AAGAAGTACC AAGGCTTACC ATCTTTATAT GTCCAAATTC GTCCACCTTC ACCACGTGCT 2160 

GATTCACTCA TTAGTCGCAG TTTATCATCA CCAGGGATTG CAGTAGGATG AATTTGAATG 2220 

AACTCACCAT TAGCATAAAT AGCGCCTTGT TGGTAAACAA TGGAAGCCGC TGATCCTGTA 2280 

TTAATCATTG AGTTTGTTGT TTTACCGAAA ATAATACCAG GGCCACCCGT TGCCATAATA 2340 

ACTGCATCTG AACCAAATGT TTCAATCTCA GCAGTTGTCA TATTTTGTGC AnCGATACCT 2400 

CTTGCACTAT CATCGTCACC TTTAACTATG CCAAGGAATT CCCATCCTTC ATACTTCGTA 2460 

- ACTAATCCAT CTACTTCATA TGCACGAACT TGTTCATCCA ATGCATATAA TAATTGTTGT 2520 

CCAGTTGTTG CCCCTGCATA TGCTGTTCTG TGATGTAATG TACCACCGAA ACGTCTAAAA 2580 

TCTAATAGAC CTTCATTTGT TCTATTGAAC ATTACGCCCA TACGGTCTAA TAAATGAATA 2640 

ATTTTAGGTG CTGCCTCTGT CATCGCTTTA ACAGGTGGTT GGTTTGCAAG GAAATCGCCA 2700 

CCATACACTG TATCATCAAA GTGAATCCAA GGAGAATCGC CTTCCCCTTT AGTATTGACC 2760 

GCACCATTAA TGCCACCTTG GGCACAAACA GAGTGCGAAC GCTTTACTGG TACAACTGAG 2820 

AACAAATCTA CATGTGCACC TTTTTCTGCC GCTTTAATTG TTGACATTAA GCCCGCTAGG 2880 

30 CCACCTCCGA CAACAATAAG ATGTTTCTCT GCCATAAAAA TTTCACTCCC CTAAATTTTC 2940 

AATCTATATT TGTTAAATGC GATGTATTAC ATAAAGGCAA TAATTGCAGT AACACCAATA 3000 

TACGAAATAA CTAAAAATAC GATTAATGAA ACCCATGTAA ATACTCGTTG TGATTTTGGA 3060 

GATTGAAGTC CACCCCAAGT AACTAAGAAT GACCATAAGC CATTTGCAAA GTGGAACACA 3X20 

ACAGCAATAA TACAAATAAT ATAAAATATT GCCCATCCAG GATGTTGCAA TGTTTCGTGC 3180 

ATTAAATCGT AATTCACTTC TTTGCCGTAA AATGCTTTTT GTAAAOGTGT TTGCCATAAA 3240 

TGGATACCAA TAAAGATAAA TGTTAAGATA CCACTCACTC TTTGGAAGAA GAACATCCAG 3300 

TTTCTAAAAA TCGAGTAATG TCCAACATTT TCTTTTGCTG TAAATGCAAX GTGTATACCA 3360 

AACAAACCGT GATATAACAA CGGAATGTAT ATAAATAAAA ATTCTACAAT AATTAGAAAT 3420 

GGTAATGATT CCATAAAGTT AGATGCCTTA TTAAACGCTT CAGCACCTTG TGTTGCTTGG 3480 

TGATTCACTA ATAAATGAAC GACCAAAAAT GCACCTATTG GGATAATACC TAATAACGAG 3540 

TGAATACGTC TTAGATAAAA TTCATTTTTT GATTGAGCCA AAAGGAGTCC CCCCTGTGAA 3600 
CGAATATTTA ATTTATTGAG CTATTTATAT TAAACGTACG CTTAACCCCC TAAAGTGATA * 3660 
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CGATCACCAA ACTGCATGTC GAACAATGTA ACATTTGGAT TCGATATTTA AAATTGCTTG 37 80 

TGATGATAAA CTTTCTCATT TAGAAAACGC TTCCACGTAC ATTCAAAAAA ATAACTTTGT 3840 

TAACCATATT GTAACATTAT TTCATATATT TTGGGGCATG AGAATGATTC TCACGCCCAG 3900 

TAATTTATTT ATGCAATTGT TCATGTAGGT TCTTTGCGAC GTTTTCAGGA ATACCTATAT 3960 

TTTTAAAATC TTCAAGTGTA GCTTCCTTCA TTTTCTTGAT TGAACCGAAT GAACGCAATA 4020 

ATAATGTTTT ACGTTTGTTA CCXJATACCAT CTATATCATC AAGTATTGAT TTCAAGCCTG 4080 

TCTTTTGACG TGTITGTCTA TGAAATGTGA TTGCGAATCT GTGAACCTCA TCTTGGATAC 4140 

GGTGCAACAA ATAAAATGCC TGGCTATTTT TCTTCAGTGG TACAATTTCT GCACTAGCGC 4200 

CATATAATAA TTCAGATGTT TGGTGTTTAT CATTTTTCTG CAAACCTGCA ACAGGGATAT 4260 

CAAGACCTAA TTCGTTTTGT AGCACATCAA TAACCCCGTT CATATGTCCT TTACCACCAT 4320 

CTACTATTAT TAAATCAGGT AATGGTAATC CTTCGTTTAA AACGCGAGAA TATCGTCGTC 4380 

TTACTACTTC TCTCATTGAT TTGTAATCAT CTGGACCTTT AACCGTTTTG ATTTTATACT 4440 

* * 

TTCTATAATT TTTCTTATCT GGTTTACCGT CGACAAATGT AACCATTGCT 6ACACTGGAT 4500 

CCACACCTTG AATATTAGAA TTATCGAATG CTTCAATTCT AATTGGTGTT TGAATTCCCA 4S60 

TTTGTGTTCC AAGTTCTTCA ATAGCTTTAA TCGTTCTGGA CTCATCACGT GATATTAATT 4620 

CAAATTTATT ATTTAAGGAT ACTTTAGCGT TATGTGCAGC TAGGTCAACC ATATCTTTTT 4680 

30 TGGGACCTCG CGCGGGTTGA ACGATTTTAG TGTCCACAAC AGATTGAATC ATTTCTTTAT 4740 

CCAAATTACG TGGTACATGA ACTTCCTTAG GTAAAATATG TTGGTTTAAG CTATAAAATT 4800 

GTCCAATAAA iX3TATAAAAT TCTTCTTcTT CTGTTTGCTG TAATGGAATC ATCXSTTGTAT 4860 

CTCGCTTTAT CATATTACCT TGTCGTATAA AGAAAACTTG GATACACATC CATCCTTTAT 4920 

CAACACTATA ACCAAAGACA TCACGAATCG TTTTATCTGA TGACATAATT TTTTGTTTGT 4980 

TTGtCAGATT TTGAATATGT TGAATTAAAT CTCTATATTC TTT AGCCCGT TCAAAATCAA 5040 

GTGATTCACT TGCAGTTAAC ATTCGCTCTT CTAAACTTTT TAAAATTGTT TTGTCTTCCC 5100 

CATTCAGAAA ATCAGTAATT TCCTTCGTCA TTTGTGCGTA TTTACTCAAA TCAACGTCAT 5160 

ATACACATGG TCCTAAACAT TGTCCAATAT GGTAATAAAG ACATAATTTA TCTGGCATCT 5220 

TATCACATTT GCGATATGGA TATATTCTGT CTAATAACTT TTTAGTTTCT TGAGCAGAAT 5230 

ATGCATTCGG ATACGGTCCG AAATATTTGC CAGTACCTTG TTTTACAGTT CTCGTCACTA 5340 

GTAGTCTAGG ATATTTCTCC TTCGTAATTT TAATAAATGG ATAACTTTTA TCATCCTTTA 5400 

ATAATATATT ATATCTTGGT TGATATTGTT TAATCAGATT CAATTCCAGT AAAAGTGATT 5460 



25 



35 



40 



45 



55 



910 



EP 0 786 519 A2 



TTTTAGCATC ATGAGCACCC GTAAAATATG ATCGCAATC 
{2) INFORMATION FOR SEQ ID NO: 200: 

* Ci) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4594 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

10 



(Xi) SEQUENCE DESCRIPTION: SEQ ID MO: 200: 



IS 


AAATCAATCG AGTGGCATGT 


CAAGGTCATA TCAATATm* 


AGAATCTGCG 


ACIATGAGAG 


60 


AGGAAATAAA TGAAATTGCG 


CGACGTATCA 


TCGTTGATAT 


TCGTGATAAG 


CAATTACGAT 


120 




ATCAAGATAT 


TGCTA'rrri'A 


TATCGTGATG 


AATCTTATGC 


TTATTTATTT GATTCCATAT 


180 


20 


TACCGCTTTA 


TAATATTCCT 


TATAATATTG 


ATACAAAGCG 


TTCGATGACA 


CATCATCCGG 


240 




TCATGGAAAT 


GATTCGTTCA 


TTGATTGAAG 


TTATTCAATC 


TAATTGGCAA 


GTGAATCCAA 


300 




TGCTACGCTT 


ATTGAAGACT 


GATGTGTTAA 


CGGCATCATA 


TCTAAAAAGT 


GCATACTTAG 


360 


25 


TTGATTTACT 


TGAAAATTTT 


GTACTTGAAC 


GTGGTATATA 


CGGTAAACGT 


TGGTTAGATG 


420 




ATGAGCTATT 


TAATGTCGAA 


CATTTTAGCA 


AAATGGGGCG 


TAAAGCGCAT 


AAACTGACCG 


480 




AAGATGAACG 


TAACACATTT 


GAACAAGTCG 


TTAAGTTAAA 


GAAAGATGTC 


ATTGATAAAA 


540 


30 


rriTACATTT 


TGAAAAGCAA 


ATGTCACAAG 


CGGAAACTGT 


AAAAGATTrr 


GCAACTGCTT 


600 




TTTATGAAAG 


TATGGAATAT 


TTCGAACTGC 


CAAATCAATT 


GATGACAGAG 


CGAGATGAAC 


660 


35 


TTGATTTAAA 


TGGTAATCAT 


GAAAAGGCGG 


AGGAAATTGA 


TCAAATATGG 


AATGGCTTAA 


720 


TTCAAATCCT 


TGATGACTTA 


GTTCTAGTAT 


TTGGAGATGA 


ACCAATGTCG 


ATGGAACGTT 


780 




TCTTAGAAGT 

« 


ATTTGATATT 


GGTTTAGAAC 


AATTAGAATT 


TGTTATGATT 


CCGCAAACAT 


840 


40 


TGGACCAAGT 


AAGTATTGGT 


ACGATGGATT 


TGGCTAAAGT 


CGATAATAAG 


CAACATGTTT 


900 


ACTTAGTAGG 


TATGAATGAT 


GGAACGATGC 


CACAACCAGT. -AraTGCGTCAA GCTTGATTAC * 


960 




AGATGAAGAA AAGAAATACT 


TTGAACAGCA 


GGCTAATGTC 


GAGTTAAGTC 


CAACATCAGA 


1020 


45 


TATTTTACAG 


ATGGATGAAG 


CATTTGTTTG 


TTATGTTGCT 


ATGACTAGAG 


CTAAGGGAGA 


1080 




TGTTACATTT 


TCTTACAGTC 


TAATGGGATC 


AAGTGGTGAT 


GATAAGGAGA 


TCAGCCCATT 


1140 




TTTAAATCAA 


ATTCAATCAT 


TGTTCAACCA ATTGGAAATT ACTAACATTC 


CTCAATACCA 


1200 


SO 


TGAAGTTAAC 


CCATTGTCAC 


TAATGCAACA TGCTAAGCAA ACCAAAATTA CATTATTTGA 


1260 




AGCATTGCGT 


GCTTGGTTAT 


ATGATGAAAT 


TGTGGCTGAT 


AGTTGGTTAG 


ATGCTTATCA 


1320 
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GTTTGACAAT GAAACTGTAA AATTAGGTGA AACGTTGTCT AAAGATTTAT ATGGTAAGGA 1440 

AATCAATGCC AGTGTATCCC GTTTTGAAGG TTATCAACAA TGCCCATTTA AACACTATGC 1500 

GTCACATGGT CTGAAACTAA ATGAGCGAAC GAAGTATGAA CTTCAAAACT TTGATTTAGG 15S0 

TGATATTTTC CATTCTGTTT TAAAATATAT ATCTGAACGT ATTAATGGCG ATTTTAAACA 1620 

ATTAGACCTG AAAAAAATAA GACAATTAAC GAATGAAGCA TTGGAAGAAA TTTTACCTAA 1630 

AGTTCAGTTT AATTTATTAA ATTCTTCAGC TTACTATCGT TATTTATCAA GACGCATTGG 1740 

CGCTATTGTA GAAACAACAC TAAGCGCATT AAAATATCAA GGCACGTATT CAAAGTTTAT 1800 

GCCAAAACAT TTTGAGACAA GTTTTAGAAG GAAACCAAGA ACAAATGACG AATTAATTGC 1860 

ACAAACATTA ACGACAACTC AAGGTATTCC AATTAATATT AGAGGGCAAA TTGACCGTAT 1920 

CGATACGTAT ACAAAGAATG ATACAAGTTT TGTTAATATC ATTGACTATA AATCCTCTGA 1930 

AGGTAGTGCG ACACTTGATT TAACGAAAGT ATATTATGGT ATGCAAATGC AAATGATGAC 2040 

ATACATGGAT ATCGTTTTAC AAAATAAACA ACGCCTTGGA TTAACAGATA TTGTGAAcCA 2100 

GGTGGaTTAT TATACTTCCA TGTACATGAA CCTAGAATTA AATTTAAATC ATGGTCT6AT 2160 

2S ATTGATGAAG ATAAACTAGA KCPAQKTTZh ATTAAAAAGT TTAAGTTGAG TGGTTTAGTT 2220 

AATGCAGACC AAACTGTTAT TGATGCATTG GATATTCGTT TAGAACCTAA ATTCACTTCA 2280 

GATATTGTAC CAGTTGGTTT GAATAAAGAT GGCTCTTTGA GTAAACGAGG CAGCCAAGTG 2340 

GCAGATGAAG CAACGATTTA TAAATTCATC CAACATAACA AAGAGAATTT TATAGAAACA 2400 

GCTTCAAATA TTATGGATGG ACATACTGAA GTTGCACCAT TAAAGTACAA ACAAAAATTG 2460 

CCATGTGCTT TTTGTAGTTA TCAATCGGTA TGTCATGTAG ATGGCATGAT TGATAGTAAG 2520 

CGATATCGAA CTGTAGATGA AACAATAAAT CCAATTGAAG CAATTCAAAA TATTAACATT 2580 

AATGATGAAT TTGGGGGTGA GCAATAGATG ACAATTCCAG AGAAACCACA AGGCGTGATT 2640 

TGGACTGACG CGCAATGGCA AAGTATTTAC GCAACTGGAC AAGATGTACT TGTTGCAGCC 2700 

GCGGCAGGTT CAGGTAAAAC AGCTGTACTA GTTGAGCGTA TTATCCAAAA GATTTTACGT 2760 

GATGGCATTG ATGTCGATCG ACTTTTAGTC GTAACGTTTA CAAACTTAAG CGCACGTGAA 2320 

ATGAAGCATC GTGTAGACCA ACGTATTCAA GAGGCATCGA TTGCTGATCC TGCAAATGCA 2880 

CACTTGAAAA ACCAACGCAT CAAAATTCAT CAAGCACAAA TATCTACACT CCATAGTTTT 2940 

TGCTTGAAAT TAATTCAACA GCATTATGAT GTATTAAATA TTGACCCGAA CTTTAGAACA 3000 

SO KGQKGIQPAQ CTGAAAATAT TTTATTATTA GAACAAACGA TAGATGAGGT CATAGAACAA 3060 

CATTACGATA TCCTTGATCC TGCTTTTATT GAATTAACAG AGCAATTGTC TTCAGATAGA 3120 
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AATCCTACAA ATTGGTTGGA TCAATTGGTG ACACCATACG AAGAAGAAGC ACAACAAGCG 3240 

CAACTTATTC AACTACTAAC AGACTTATCT AAAGTATTTA TCACAGCTGC TTATGATGCT 3300 

TTAAATAAGG CGTATGATTT GTTTAGTATG ATGGATAGCG TCGATAAACA TXTAGCTGTT 3360 

ATAGAAGATG AACGACGTTT AATGGGGCGT GTTTTAGAAG GTGGCTTTAT TGATATACCT 3420 

TATTTAACTG GTCACGAATT TGGCGCGCGX TTGCCTAATG TAACAGCGAA AATTAAAGAA 3480 

GCAAATGAAA TGATGGTCGA TGCCTTAGAA GATGCTAAAC TTCAGTATAA AAAATATAAA 3540 

TCATTAATTG ATAAAGTGAA GAGTGATTAC TTTTCAAGAG AAGCTGATGA TTTGAAAGCT 3600 

GATATGCAAC AATTGGCGCC ACGAGTAAAG TACCTTGCGC GTATTGTGAA AGATGTTATG 3660 

TCAGAATTCA ATCGAAAAAA GCGTAGCAAA AATATTTTGG ATTTTTCTGA TTATGAACAT 3720 

TTTGCATTAC AAATTTTAAC TAATGAGGAT GGTTCGCCTT CAGAAATTGC CGAATCATAC 3780 

CGTCAACACT TCCAAGAAAT ATTGGTCGAT GAGTATCAAG ATACGAACCG AGTTCAAGAG 3340 

AAAATACTAT CTTGCATCAA AACGGGTGAT GAACATAATG GTAATTTATT TATGGTTGGA 3900 

GATGTTAAGC AATCCATTTA TAAATTTAGA CAAGCTGATC CAAGTTTATT TATTGAAAAG 3960 

TATCAACGCT TTACTATAGA TGGAGATGGC ACTGGACGTC GAATTGATTT GTCGCAAAAC 4020 

TTCCGTTCTC GAAAAGAAGT ACTGTCAACG ACTAACTATA TATTCAAACA TATGATGGAT 40 30 

GAACAAGTCG GTGAAGTAAA ATATGATGAA GCGGCACAGT TGTATTATGG TGCACCATAT 4140 

30 GATGAATCGG ACCATCCaGT AAACTTAAAA GTCCTTGTTG AAGCGGATCA AGAACATAGT 4200 

GATTTAACTG GTAGTGAACA AGAAGCGCAT TTTATAGTAG AACAAGTTAA AGATATCTTA 4260 

GAACATCAAA AAGTTTATGA TATGAAAACA GGAAGCTA7A GAAGTGCGAC ATACAAGGAT 4320 

ATCGTTATTC TAGAACGCAG CTTTGGACAA GCTCGCAATT TACAACAAGC CTTTAAAAAT 4330 

GAAGATATTC CATTCCATGT GAATAGTCGT GAAGGTTACT TTGAACAAAC AGAAGTCCGC 4440 

TTAGTATTAT CATTTTTAAG AGCGATAGAT AATCCATTAC AAGATATTTA TTTAGTTGGG 4500 

TTAATGCGCT CCGTTATATA TCAGTTCAAA GAAGACX3AAT TAGCTCAAAT TAGAATATTG 4560 

AGTCCAAATG ATGACTACTT CTATCAATCG ATTG 4594 
(2) INFORMATION FOR SEQ ID NO: 201: 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 6313 base pairs 

(B) TYPE: nucleic acid 
{C) STRANDSDNESS: double 
(D) TOPOLOGY: linear 
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GGTTTTCnTG GAAAGATAGT GAAAATCTCG 
TTTaTAAAAT GGCTTACATA TATGAAGCGT 
^ ACCTATTTAG CTTTAAGAAG GCATAACAAG 

TTATGCGAAG ATTAAGGTGA GTAGTAAATT 
AGTGTTGAAA CAGCACAACG AAAAAGAAAA 

10 

ACAAAGGCAA TCTAACTTTA TTCGGTATGT 
TACAATAAAA GTGGATGATG ATAGCGTTAA 
TTTGCATTTT GTTGAAGGAC AAACGACAAC 
TCCACTAGAA GTTAAAACAT TACGCATTTT 
AAAGATTCAT. TATGAATTAT ATCAAGATAA 
TAACTATAAG GAGATAGGCG AATGAATATT 

20 

GAAATTGCAG CAAGTATTAA CAAAGCAGGA 
- GAAGTTCCTA AAGATACAAA AAATGGAGAT 

25 AAGATTGCAA AGCGTAATCC TCGTGAAATT 

GAAAAAGCAC ATGTAAAACA AATTGACATT 
GATAATCAGT ATTTAACAGC AATTATTCCT 

^0 CATGTAAATG AATCAAAAGG TCAAAATGTA 

GGAGATTTAC ATATTGGTCA TGCTAGAAAT 
TTAACTGCAG CTGGCTATAA TGTAACACGT 

35 

ATTACTAACT TAGCGCGTTC GATTGAAACA 
TATT CAATGC CAGAAGATGG CTATAATGGA 
GCAGAGAAAC ACCCTGAAAT TAAAGATTAT 

40 

AAATTAGGCG TAGAATACGA AATGGCTAAA 
CATTTTGATA ATTGGTTTAG TGAAaCATCT 
TTAGCAAAAA TGAAAGAATT AGGTTATACG 

45 

ACAACTGATT TTAAAGACGA CAAAGACAGA 
TATTTCTTAC CAGATATTGC GTACCACTTC 
SO ATCGATTTAT TTGGTGCTGA TCATCATGGT 

ACGTTTGGTG TAGATAGTAA TCGTTTAGAA 



TGTTTTTTGG TTTTgAGGTG TTGTTTGTAT 60 

TGATTAAGTA TGGAATTGTT AATTAATTGA 120 

ATGACCTTAT TTTATGCTAT AATATTTCTA IBO 

GGATAAAAAA GTAAGTATTC AAACAAAGCA 240 

ATTTGAATTT ACTACTGAAG GAACTTGGCA 300 

AGAACAAATT GAGGATGCAA CAGTTAATGT 360 

GTTGATTCGT AAAGGCGACA TTAATATGAA 420 

AACmTTAC GATATATCGG CTGGACGAAT 480 

ACATTTCGTA AGTGGAGACG GTGGCAAGCT 540 

TGAAAAAATG GGTTCTTATC AATATGAAAT 600 

ATTGATCAAG TGAAACAAAC ATTAGTAGAA S60 

TTAGCAGATG AGATTCCTGA TATTAAAATT 720 

TATGCTACTA ATATTGCGAT GGTACTGACT 780 

GCTCAAGCGA TTGTTGATAA CTTAGATACT 840 

GCTGGTCCAG GATTCATTAA TTTTTACTTA 900 

GAAGCAATTG AAAAAGGTGA TCAATTTGGA 960 

TTGCTTGAGT ATGTTTCAGC TAACCCTACA 1020 

GCAGCAGTTG GTGATGCTTT AgcTAAtATT 1080 

GAATATTATA rTAATGATGC TGGTAATCAA 1140 

CGTTTCTTTG AAGCTTTAGG TGACAATAGT 1200 

AAAGATATTA TTGAAATAGG TAAAGATTTA 1260 

TCTGAAGAAG CACGTTTGAA AGAATTTAGA 1320 

TTGAAAAATG ATTTAGCAGA GTTCAATACG 13 80 

TTATATGAAA AAGGAGAAAT TCTTGAAGTT 1440 

TATGAAGCTG ATGGCGCTAC ATGGTTACGT 1500 

GTATTAATTA AAAATGACGG TACATATACG 1560 

GATAAAGTAA AACGTGGTAA TGACATTTTA 1620 

TATATTAATC GTTTGAAAGC ATCTCTTGAA 1680 

ATTCAAATCA TGCAAATGGT TCGTTTAATG 1740 
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ATTATGGACG AaGTTGGCGT TGACGCTGCA CGTTATTTCT TAACTATGCG TAgTCCTGAT 1850 

AGTCACTTTG ATTTTGATAT GGAATTAGCG AAAGAGCAAT CTCAAGACAA TCCAGTTTAC 1920 

TATGCTCAAT ATGCACATGC GCGTATTTGT TCAATTTTAA AACAAGCGAA AGAGCAAGGT 19S0 

ATTGAAGTGA CTGCTGCGAA TGATTTTACA ACGATTACTA ATGAAAAAGC GATTGAATTG 2040 

TTGAAAAAAG TAGCTGATTT CGAACCTACA ATTGAAAGTG CTGCTGAGCA TAGATCGGCA 2100 

CATAGAATTA CTAATTATAT TCAAGATTTA GCTTCTCATT TCCATAAATT CTATAATGCT 2160 

GAAAAAGTGT TAACAGATGA TATTGAAAAA ACAAAAGCAC ATGTTGCTAT GATTGAAGCG 2220 

GTCAGAATTA CATTGAAAAA TGCATTGGCA ATGGTCGGTG TAAGCGCACC TGAATCAATG 2280 

TAAGAACATT TATATACACT CCAACGTAGA GTTTCTCGAA AGATACTTTG TGTTGGAGTG 2340 

TTTTTTTTAG GTATGTGACA TATTGGGGAA TGCTTAGTAT GTGAATAAGG TTAAGAGGAA 2400 

CACAGTTGGA TGCTCTGCAC AACTGCATAA GAGAGCCTGA GACATAAATC AATGTTCTAT 2460 

GCTCTACAAA GTTATAATGG CAGTAGTTGA CTGAACGAAA ATTCGCTTGT AACAAGCTTT 2520 

TTTCAATTCT AGTCAACCTT GCCGGCGGGG CCCCAACAAA GAGAAATTGG ATTCCCAATT 2530 

25 TCTACAGACA ATGCAAGTTG GGGTGGGACG ACGAAATAAA TTTTACGATA ATATCATTTC 2640 

TGTCCCACTC CCTCTAAAAT GGAGGGTGTA AATGTTAGGA ACTGATGAAT TATATAAAGT 2700 

TTTATATGAA CATCTCGGAC CACAATTTTG GTGGCCTGCT GATAATGACA TTGAAATGAT 2760 

30 GTTAGGTGCA ATTTTAGTTC AAAATACTAG ATGGCGAAAT GCAGAAATTG CATTGAATCA 2820 

GATTAAAGAA CATACGCATT TTAATCCAAA TCATATATTA GAACTACCTA TTGAAACGTT 2880 

ACAATCATTG ATACATTCAA GTGGCTTTTA TAAAAGTAAA TCACTGACGA TTAAAACATT 2940 

ATTAACATGG TTAGCACGAC ATCATTTCAA TTATCAAGAG ATTAATGAGC GATATAAAGG 3000 

TGGATTAAGA AAAGAATTAT TATCTTTGAA AGGTATTGGA AGTGAAACAG CAGATGTCTT 3060 

ACTTGTTTAT ATATTCGGAC GTATTGAATT TATTCCAGAT AGCTATACAA GAAAAATATA 3120 

TGATAAATTA GGATATGAAA ACACTAAAAA TTATGATCAA TTAAAAAAAG TAGTCaCATT 3130 

ACCAAATCAT TTTACAAATC AAGATGCTAA TGAATTTCAT GCTCTGTTAG ATGTATTTGG 3240 

TAAACATTAC TTTAGAGACA AAGATATAAA GAATTATGAT TTTTTAGAAC CTTACTTTAA 3300 

AAAGTAAACG CTGTGAAGTT AGATAGATGA GTTTATATGA AATATAAAAA ATAATTTACT 3360 

ATTTTCTTTT AGTATGTGGA CTTATATAAT AAATAGAAGC ATATAAAGAA AAAAACAGTT 3420 

50 GTTTGTTTGT GCAGCAACTG CATAAGAGCC CCTAATCGCT AAAGCTCAAG GGGAGTAAAG 3430 

GAATACAGTT GTTTGTGCAG CAACTGCATA AAAGCCTCTA ATCACTAAAG GTGAAGAGGA 3540 
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AACGCAGTTG GATgCTACCG CACAACTGCA TAAATCCCTC TaATCgcTAA AGCGAAAAGT 3660 

GGGATTAAAA AGGAGATGTG ATAGTGTGAA GAAATCGTTA ATTGCTTTTA TTTTGATTTT 3720 

TATGCTTGTC CTGAGTGGCT GTGGTATGAA AGATAATGAT AAACAAGG7A GCAATGATAA 3780 

TGGCTCGTCT AAATCGCCGT ACCATAGAAT TGTTTCGTTA ATGCCTAGTA ATACTGAAAT 3840 

TTTATATGAA TTAGGATTAG GTAAATACAT AGTTGGTGTT TCAACGGTTG ATGATTATCC 3900 

AAAAGATGTG AAAAAGGGTA AGAAACAATT TGATGCTTTG AATCTAAATA AAGAGGAACT 3960 

TTTAAAGGCA AAGCCAGATC TAATTCTTGC GCATGAGTCG CAAAAGGCAA CTGCTAATAA 4020 

AGTATTGTCA TCATTAGAGA AACAAGGCAT CAAAGTAGTG TATGTTAAAG ATGCACAATC 4080 

AATTGATGAA ACTTACAACA CATTTAAGCA AATTGGGAAA TTAACGCATC ATGATAAGCA 4140 

GGCTGAACAA CTTGTTGAGG AAACTAAAGA TAATATCGAT AAAGTCATAG ATTCAATTCC 4200 

TGCTCATCAT AAAAAATCAA AAGTATTTAT TGAGGTTTCA TCAAAGCCTG AAATATATAC 4260 

AGCAGGGAAG CATACATTTT TTAATGATAT GTTAGAAAAA TTAGAAGCCC AAAATGTGTA 4320 

TAGTGACATT AATGGTTGGA ACCCTGTAAC GAAGGAAAGT ATTATTAAAA AGAACCCAGA 4380 

TATATTAATT TCGACGGAAG CTAAGACAAG ATCAGATTAT ATGGATATCA TCAAAAAAAG 4440 

AGGTGGATTC AATAAAATTA ATGCTGTCAA GAATACACGT ATTGAAGTTG TAAATGGTGA 4 500 

TGAAGTATCA AGACCAGGTC CACGTATTGA TGAAGGATTA AAAGAATTAA GAGATGCAAT 4560 

30 TTATAGAAAA TAAACCATTC TAATTATGCC CCTTATTGCT ACATGTAAAA AATACATGTT 4620 

TGAGATAAGG GGTTrTTaAA ATATATTTAG TGAATGATAG CAACGCGAGT ATGTGATTGC 4680 

TATAATGAAT GTAATTATCG ATGAAcaaAA GAGAATGCTA TGACATTTAA TAAAGTATTA 4740 

TTGAGCTGGa TAGTCmTATT GATTATAACA ACTAGCATAT ATCTATTTTG GCAGTTGGGC 4800 

GATMCAATG ATGTATTTAA CCAGTCTATT TTAATCAATG TTAGATTACC GAGATTATTA 4 860 

- GAAGCATTGT TGACAGGTAT GATATTAACT GTTGCAGGCC TTATATTTCA AACAGTTTTA 4 920 

AATAATGCAT TGGCAGATAG CTTTACATTA GGATTGGCAA GCGGCGCTAC ATTTGGTTCA 4980 

GGATTAGCAT TATTTTTAGG TTTAACAACG TTATGGATTC CTGTATTTTC AATAACATTT 5040 

AGTTTGATAA CATTAATAAC TGTATTAGTC ATTACGTCGG TATTGAGCCA AGGCTATCCA 5100 

GTTAGAATCT TAATATTAAG TGGTTTAATG ATTGGTGCGT TATTCAATTC ACTTCTATAT 5160 

TTTTTGATTT TATTAAAACC TCGCAAATTA AATACAATTG CCAATTATCT GTTTGGTGGT 5220 

TTTGGTGATG CAGAATACTC AAATGTATCT ATAATAGCAA TCACATTTAT CATTGCATTG 5280 

TTTGGTATAT TTATCATTCT TAATCAACTA AAGTTATTGC AATTAGGAGA ACTAAAAAGT 5340 
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ATAACGGCGA TAAATGTCGC ATATGTTGGC ATCATTGGAT TCATTGGTAT GGTGATACCG 
CAACTCATTA GAAAATGGCA GTGGAAACAA TCATTAGGAA GACAATTGGC TTTAAATATT 
GTAACTGGAG GACAAATAAT GGTTATGGCA GATTTTATTG GTAGCCATAT ATTGTCACCA 
GTACAAATAC CGGCAAGTAT TATCATTGCA TTAATTGGTA TACCAGTGTT AtTTTACaTG 
CJcAAwACCtC aGTCgAAAcG GTTACaCTAG CACACGACaT TTGCTAAAAT AAAAATAACT 
ATAAACATAA AGAGGGCATA AGCGATGGAT TTGAATCAAA TTAAAGCAGT TGTATTTGAT 
TTAGAAGGTA CGTTGTTGGA CAGAGTTAAA TCTCGAGAGA AATTTATCGA AGAGCAATAT 
GAACGATTTC ATGACTACTT AATTCATGTT CAACTGGCAG ATTTTAAAAA AgCATTTATT 
GAGCTAGATG ACGATGAAGA TAATGATAAA CCTGATTTAT ATAAAGAAAT CATTAAACGT 
TTCCATGTAG ATAGGTTAAC TTGGAAAGAC TTATTTAATG ATTTTGAAAT GCATTTTTAT 
CGTTATGTAT TTCCTTATTA CGATACTTTG TATACACTAG AAAAgCTATC GCAAAAAGGC 
TTTCAAATTG GTGTTATCGC AAATGGTAAA TCTAAGATTA AACAATTTCG ATTACATTCA 
CTTGGTTTGA TGCATGTTAT TAATTATTTA TCAACATCAG AAACAGTTGG TTTTCGTAAA 
CCACATCCTA AAATTTTTGA AGATATGATT GATCAACTAG GGGTATTACC TGAGCAAATT 
ATGTATGTTG GCGATGATGC GTTAAATGAT GTAGCTCCAG CACGAGCTAT GGGCATGGTT 
AGTGTATGGT ATA 

(2) INFORMATION FOR SEQ ID NO: 202: 

Ci) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2174 bass pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

' Cxi) SEQUENCE DESCRIPTION: SEQ ID NO: 202: 
CCGTAAACAC ATCAACAAAA GAAGGCTATA TTACAAAAGA AGACTTGGAC TTATGCTGCA 
CGTCGCTCTA ATTCAGCTGG AATGCAAGTC ACCGGACGAC TGGCTTACAT TGAACCTTAT 
GGGGCAACAA GTCGCACAAA ATAAACGCGC GAGAAGCaAG AATAGGAAGT GATATCTATG 
AAATGGTTAT CACGAATATT AACAGTAATA GTGACCATGT CtATGGcGTG TGGTGCATTG 
ATATTTAATC GTAGACATCA GCTAAAGGCG AAAACGCTGA ACTTCAATGA TAAAGCATTA 
ACAATTATTA TTCCGGCTAG AAACGAAGAA AAAAGAATAG GTCATTTACT ACATTCGATA 
ATACAACAGC AAGTTCCAGT AGATGTCATT GTTATGAATG ACGGATOGAC AGATGAAACA 



917 



EP0 786 519 A2 



10 



15 



20 



25 



30 



35 



40 



45 



SO 



AAATGGTATG GGAAATCACA TGCTTGTTAT CAAC3GTGTGA CGCATGCATG TACGAATCGC 
ATTGCCTTTG TAGATGCTGA TGTAACTTTC TTAAGGAAAG ATGCTGTTGA AACGTTGATT 
AATCAGTATC AATTACAAGG TGAAAAAGGA TTGTTAAGCG TACAGCCTTA TCATATAACA 
AAGCGTTTCT ACGAAGGGTT TTCAGCGATA TTTAATTTAA TGACAGTCGT TGGTATGAAT 
GTATTTTCTA CCTTAGACGA CGGTCGGACT AACCAGCATG CATTTGGACC GCTGACATTA 
ACAAATAAAG AAGATTATTA TGCAACTGGA GGTCATAAAA GTGCAAACCG TCATATTATT 
GAAGGATTTG CTTTAGGAAG TGCATATACT TCACAATCAT TGCCCGTAAC AGTTTATGAA 
GGGTTTCCAT TTGTTGCATT TCGCATGTAT CAAGAAGGAT TTCAGTCATT ACAAGAAGGA 
TGGACAAAGC ATTTGTCAAC TGGGGCAGGT GGCACAAAGC CTAAGATCAT GACAGCAATT 
GTGTTGTGGT TGTTTGGTTC TATAGCGAGT ATTTTAGGGC TATGTCTTAG TTTAAAATAT 
CGCCAAATGT CTGTAAGAAA AATGGTAGCA CTTTACTTGA GCTATACTAC ACAATTTATT 
TATCTGCATC GAAGGGTCGG CCAATTTTCT AATTTATTAA TGGTATGTCA TCCATTGTTA 
TTTATGTTTT TTACTAAAAT TTTCATCCAA TCTTGGAAAC AAACGCATCG TTATGGTGTA 
GTTGAATGGA AAGGTCGTCA ATATTCTATA TCTAAAGAAC AATAAATCAA GGTAATGGCA 
TTTCAATATA GGAGGACTAG TATGACAATG ATGGATATGA ATTTTAAATA TTGTCATAAA 
ATCATGAAGA AACATTCAAA AAGCTTTTCT TACGCTTTTG ACTTGTTACC AGAAGATCAA 
AGAAAAGCGG TTTGGGCAAT TTATGCTGTG TGTCGTAAAA TTGATGACAG TATAGATGTT 
TATGGCGATA TTCAATTTTT AAATCAAATA AAAGAAGATA TACAATCTAT TGAAAAATAC 
CCATATGAAC ATCATCACTT TCAAAGTGAT CGTAGAATCA TGATGGCGCT TCAgCATCTT 
GCACAACATA AAAATATCGC CTTTCAATCT TTTTATAATC TCATTGATAC TGTATATAAA 
GATCAACATT TTACAATGTT TGAAACGGAC GCTGAATTAT TCGGATATTG TTATGGTGTT 
GCTGGTACAg TAGGTGAAGT ATTGACGCCG ATTTTAAGTG ATCATGAAAC ACATCAGACA 
TACGATGTCG CAAGAAGACT TGGTGAATCG TTGCAATTGA TTAATATATT AAGAGATGTC 
GGTGAAGATT TTGACAATGA ACGGATATAT TTTAGTAAGC AACGATTAAA GCAATATGAA 
GTTCATATTG CTGAAGTGTA CCAAAATGGT GTTAATAATC ATTATATTGA CTTATGGGAA 
TATTATGCAG CTATCGCAGA AAAAGATTTT CAAGATGTTA TGGATCAAAT CAAAGTATTT 
AGTATTGAAG CACAACCAAT CATAGAATTA GCAGCACGTA TATATATTGA AATACTGGAC 
GAaGTGAGaC AGGCTAACTA TACATTACAT GAACGTGTTT TTGTGGaTAA GAGGAAAAAG 
GCAAAGTTGT TTCA 
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600 
. 660 
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730 
840 
900 
960 
1020 
1080 
1140 
1200 
126Q 
1320 
1380 
1440 
ISOO 
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1920 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4715 base pairs 

(B) TYPE; nucleic acid 

(C) STRANDEDNESS : double 
5 (D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 203: 

10 

GAAnCAGnTA GACAAATTAT GGaAAmCGGT GTGAATCaAG GATTCtTTGG TGTAGCTGGT 60 

. TTTGACCTAC TCGTCGATGA GGATGATAAC GTTTATGCGA TTGATTTAAA CTTTAGACAA 120 

AATGGTTCaA CGAGCATGTT ATTACTTGCT AACGAGTTGA ATTCAGGATA TCAAAAGTTT 130 

75 

TATAGTTATC ATTCAAAAGG TGATAACACA CATTTCTTCA ATACGATTTT GAAATATGTC 240 

AAAGAAGGTA GTTTATACCC GTTATCTTAT TATGATGGTG ATTGGTACGG TGAAGATAAA 300 

GTTAAATCAA GGTTTGGCTG TATTTGGCAT GGTGATTCAA AAGAAACAGT ACTGGAGAAT 360 

20 

GAACGCGCAT TTTTAGCTGA ACTTGAACAC TATTAQAGTT CGGAACATAA GGCGCTACAA 420 

TGTTGTGTTG CCAGTAGTTG ACTGAATATG CGTTTGTAAC AAGCTTTTTT CGATTCTAGT 480 

2s CAACAGTAAT TAAATTTATG ATATGGCAAT ACTTTGTAAT ACTAATATTA AATGGCGACT 54 0 

TTTATTTCAC TATGTTATAA GAGTTGCCAT TTTGTTGATA AAGGTATACT AAAGGTTATC 600 

GTTTTGAAAT TTTTAGTAAC TAGATATGTT TCGTGTTATA GACCGAATTT GTGTATACGT 660 

30 AAAATTTAAT GCTATTGAAT TTTTAAAATG AAAAACATGA CATTAAATTG AATTCATAAT 720 

ATGTCTAATT GACTAACTTG TTGGAGTCAT TTACTATTTT ATGTATGACA TATTTTAAAA 780 

AGTGAGGGTC AAGCATGTCT TATAAAGCAT ATCCATTCTT TAGAGATATA TTAATAAATG 840 

AATGTATTTA TTTCGCCTCT AAAAATAAAA AACTAGTACG CCTAAATTAT AAAAGTGAAG 900 

CGnAlGTAGG CGTTTGGACA GAAGAAAGTG TGGCCGTATC ATTTTTAACA AGTCGTGATA 960 

TTCCATTTGA TAAAGTTGTA AAAATGGACG TTGATCGTTT TGCTACTTAT GAATTAGATG 1020 

40 

AATTGTTTGA TGAACAAGAC CATATTATTA TGAATCAAAC AATGGAAGAw GAAGGGCATC 1030 

TACTAAACGT TGTAGCTGTT ACACAAGAAG TGATGACGGA ATTAGATAAA ATTAGAATCA 1140 

AAGAATTTGT CCAAGATGTA GCGAAATATG ATGAAGTATA CGGCTTAACT AAAAAAGGTA 1200 

45 

GTAAGCAGTT TATTCTCATT AGTGAAAATG ATAGCGACGA AAAAAAGCCG CATATTATGC 1260 

CTGTATGGAG TATTAAAAAC AGAGCGTTAA AAGTTCGAGA TGAAGATTTT GAAGAGTGTG 1320 

SO ATTTAATTAC GATTGAAGGT TCTGTTTTCG GAGAATGGCT AGATGAACTT AGAGATGATC 1380 

ATAAAGCCGT TGCGATAGAT TTAAAAACTG GCGTGGTTGG TACAATTGTT TCAGCGCAAA 1440 
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ATGGAACAAT ACGTATTCAA AACACTTAGA 
TTATTTAAAA CAACGCGCAT ATAAATGGTC 
^ ATAGCACCTG nAAAATGCGC CGTTTTCAAC 

ATAATCTTCC ACAACTTTGC GTAATAAAGC 
GATATTTTCA GTTTTAAATT CACGTGCAAC 

10 

AACGACACCA ATAACGGCTG CTAATTTATT 
TAGTACATGA CCAAAATTAG CTGCTGTTAA 
ATAAATATGT CTAACCTTTA AATCGATAGT 

15 

TAACTGTTTA TAATCAGTGA TTTGACTTAG 
ACCTGTACCG ATACCGCCTA CACGACXJTTG 
ACCGGTACCA ACATTTGCAA AAATATAATC 
AATACCTAGT CCTTGAGATG CAGCATCAAA 
GTTTTCAGCA ATGACACCTG CATTACCTCC 
25 GTTTAACCAT TCCACAACTT GATCAATATT 

GTTATCTTGC TCTTGAACGA TTrXAATTAG 
AAGATTCCCA CCTCATTATT AATGTCTATC 
AAACAAGTAA TAATAGTAAT TATTAACAAA 
cGTATCGCAA TTAAtGTTTT ACAAACGTGG 
ATTTTGAAGT TGTATAGGAT TGTTAGTTAG 

35 

GTGTATTTGT AAGTCTCTGA TTAAAATGAT 
AATTTAAAAA ATATAAATAA GTAATTTATT 
AAATAATAGG TAAAATAATA TGGGGATTCA 

40 

TATATGGCTA AAGAACTTTG TITTGAAGGT 
CGTTCAGCAA TTAATGATTT TGACTTGAAT 
AAAGAAGTTA TTGATGATGC AATTAATGAT 
GATAAAAATG AAGTGGTGGG CTTTTTTGTA 
GATACACCTG AAAATGTCGT TTATATTCGT 
SO TTTGGATATG GCACGAAAAT AATGATGTCA 

GATTTTAATC ATCTATATCT AGTAGTAGAT 
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CCATAAAATA AAAGGCCATT TATATAGCGT 1560 

TTTTTCTATT TTTCTAAATA TAATGCACCA 1S2Q 

ATAGTACGGT TTGCAACCGC GTAACACAGT 1680 

GTTATTATGA AATGAAGAAC CGATATAAAC 1740 

AGTAATGGCC ATTGTCGTAA CAACTTCGCC 1800 

GCTAGGTGTA AAATCAGCAT CTAAATGATG 1860 

ATCACCGGGA ATGGGTGGTT CGGTATCTTT 1920 

GTTACGATCA CCGTGTTGTG CCATGTCAGT 1980 

TAAATAACCG AGTCCTTGAA TCATGCCTCC 2040 

TGATTGGCCG TCGAAATAAT GTAGTGACGT 2100 

TGCTAAGTCA TGGCCTTGCT CTTTTAACAA 2160 

CTCTACAAAA ATTTGTGCAG GAATGTTGAT 2220 

AGTTAAGCAT AATTTTTCAA TTTGCTGTTG 2280 

TTTAGTTAAT TCAGTTTTAA AAGTACGTTG 2340 

TGTACCGCCA GCGTCAATGC CAACTTTCAT 2400 

CTTAAATAAT AGTATAGTAA AATGACTAAA 2460 

TTTGATGCCa TTGCATTTCA ACATTGTAAG 2520 

ACGTTAAGTt ATATATATTA TTTTCTAGGA 2580 

TGACGCAATA TTAAAAGTAG TTCGTACGCA 2640 

AAGTAATGAG GAATAGTACA TTAATTTTGA 2700 

TAACTTACAG CAAATAATGG TATCGTAGTG 2760 

TGCTTCATAT ATAAAAAGAT AGGGGTTAAA 2320 

ATCACTTTAA AAGCATTTGA TGAACAATAT 2880 

GAAAGACAAC AAATATATTC ATCTTTACCT 2940 

GCTGATAGGA TTGCTAACGT AGCAwTAAmC 3000 

TTACATCGTT ACTATCAGCA TGAAGGTTAT 3060 

TCATTATCGA TTAATGAAAA ATATCAAGGT 3120 

TTGCCGCAAT ATGTTCAAGG TGTATTTCCT 3180 

GCGGAAAATG ACAATGCTTG GAACCTATAC 3240 



920 



EP 0 786 519 A2 



CTATATTACT TGGACTTAGA TTCAAAACAT GTTTCATCAT TAAAGCTTGA AGAAGAAAGT 3360 

CGTTCAGAAG TGACCAATGT ACATATCATT AATTTAATGA TTGATGGCCA AAAGGTTGGC' 3420 

^ TTTATCGCAT TGGAGCAGAT TGGTGAACGC ATGAACATTG CTGCTATTGA AGTGGATAAA 3480 

TCATATCGCT TTAATGGTAT TGGTTCAAGT GCTCTGCGAC AATTGCCAAC TTACXTAAGA 3540 

AAAAACXATG ACAACCTTAA TGTGATTACG ATGATTCTGT TTGGAGAGAA TAATGATTTT 3600 

10 

AAACCATTAT GTTTAAATAG TAATTTCGXT GAAATCGAAC AAACTGATGA TTATGTCGTT 3660 

TTCGAAAAAT ATTTAAATTA CTAACAGTGA TTGCGAAATA TGATATTGTC ATTTATAATT 3720 

TAGTTTTGTT ACTATATATA AATGAATTCA GACGTATAAA TTTAGATTAT ATCCTTCGAA 3780 

75 

AGGAAGTATT GGGCAATGAA AATTCAAGAT TATACAAAAC AAATGGTTGA TGAAAAATCA 3840 

TTTATTGATA TGGCTTATAC ATTATTGAAT GATAAAGGCG AAACAATGAm irtTTATATGAT 3900 

20 ATyATCGATG AATTXAGAGC GTTAGGTGAT TATGAGTACG AAGAAATTGA AAATCGTGTT 3 960 

GTACAATTTT ACACGGATTT AAACACAGAT GGTCGTTTTT TAAATGTTGG AGAAAATTTA 4020 

TGGGGATTAC GTGATTGGTA TTCGGTAGAT GATATTGAAG AGAAAATCGC ACCAACTATT 4090 

25 CAAAAATTCG ATAXTCTGGA TGCAGATGAT GAAGAAGATC AAAACTTAAA ATTATIGGGC 4140 

GAAGATGAAA TGGATGACGA CGATGATATT CCAGCTCAAA CAGATGATCA AGAAGAACTA 4200 

AATGATCCAG AAGATGAGCA GGTTGAAGAA GAAATCAATC ATTCGGATAT AGTCATTGAA 4260 

30 

GAAGATGAAG ATGAACTAGA CGAAGACGAA GAAGTGTTTG AAGACGAAGA AGACTTCAAC 4320 

GATTAATTTT TTGTTTGACT TTTAGTTGAA AGATGATAAA ATTTTATTCG GGCTCCTTTA 4380 

AATAGGACAC GTGTATAAAA TTTATACGCT CCCCTTACAG AATTTGTGAG AGGGAGCGTT 4440 

35 

TTTTtATTTA ATTGAGTAAA TCAAGAAATG ATAACGCAAA AATCAAAGTT GTAAATGATA 4500 

TACAJAGTGA CATAGCAGTA TGGAAACGGT AAGTAAACAG AATTTAATTT TGTCGAtTCG 4560 

ACAAtAAaCA aCTtGAaXGA GCTTGCTTTA ATGTTATGTn nXACGTAATT TTTACAATTG 4620 

40 

ATGAGGAAGC ATTCCCTTTA ATAATTAGGA GGTCAAGACA TGACAAAATT TATTTTTGTA 4680 

ACAGGTGGCG TAGTTTCATC CATTAGGGGA AGGGT 4715 
45 (2) INFORMATION FOR SEQ ID NO: 204: 

(i) SEQUENCE CHASACTBRISTICS : 

(A) LENGTH: 913 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
50 (D) TOPOLOGY: linear 
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ATAATAACTG AAATTAAAAT TGCTAAATmG TGTTaAgCTA TCGCmACAAT GAAAATwCCG 
ATTTTGCGTT GTTGAAAATA TCTTTCCAAA CCAAGAATCG ATAATGGCAA TAAATATAAT 
AAATTTCCAT AAAATGACCA AGTAAAATTA AAGTATATAA CGACAGTTGA CATGCCGTAT 
AAAATCGTAG CGATCATATT TGCTGAGCGT TTAAAGTGTA ATATTTTAAA TAAGTAGAAG 
GTCACGACAA ATGTTATGAT AGCTCGTATC ATAGCCATAA TAAGTTGGTT TGTCGGCCAA 
AAATGTATTG TCGTCGGATT AAATATACCA ACCGTTTCTC CTATTTTAAT GAAkAGAAAA 
TTTAGCCACA TTAAAGGTGA CAGCGAATAA TAATnTGATA GTCCTTTCAT ATAATCGCCA 
CCTAmTCCAA ACGATGCATC ATTTAAACTA GAAnAACTAC GTAGATGTTC ATACAnATAC 
ATTTGAAATG GCATCATTTG ACGGAATCCA TCTCCAGCCC CGCTAAAAAC AGTACCATTC 
ACAATATAAT CATAGATATG AGTAGAAAAT AAAATAAGCG TTAATATTAC ACTAATGAAA 
GTTATAACAA AGAATTGTTT GACGTTTGAA TTTAGCCACT TTTTTAACAC AACATTATCC 
TCAACTTTCA AATTTAAAAT TAAGTTTAAC TGAAACTAAA GTTAATGAGG TTCTTGATAG 
GTAAAGACGA AGATGACTGT GGAACAGATA CCTTATCATA GTTACTTAAA CTTTGGATCA 
TTTTCAGTTT ATCATTAAAC AAATATATTG AATAATAAAa aTGTCATACT GATAAAGATG 
AATGTCACTT AATAAGTAAC TTAGaTTTAA CAAATGATGA TTTTTAATTG TAGAAAACTT 
GAAATAATCA CkTATACC 

(2) INFORMATION FOR SEQ ID NO: 205: 

(i> SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 16397 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: .205: 
TCGCCCnATA ATCAATTTAT TTTTCATGTG CCACTCCTAT ACAAGCTnAC AATGCTTCTT 
CAGTTAAGGC AATATCTTTT AATTTTGTTT GATATTTTTG TTCAAAGTCA TATTGTAACT 
GAACAATTTC TGGCAAACCA ATATGCCAAT CCGCCAATTT TTTTTTAyCT TtGAAGAGCT 
CTTTTGGTGA TGkTTGcGAC ACTATACTAC CTTCTTTCAT AACGATGACT TCATCTGCAT 
AACGCGCGAC TTCATTCATA TCATGTGAAA TTAGGATAAT TGCCTTATTT TCATCTGTTT 
GTAGTGACTT TAGTAATCTC ATTACTTGTC GTTTACTTTG TGGATCAAGT CCTGCTGTAG 
GTTCATCAAC CACGATAATA TCAGGATTCA TTGCCAATAT CGATACAATC GCTATTTTAC 
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AATCCATCAA CAGACGATGG GCATAGTTTT 
TAGGTCCAAA TATCATTTCA CX5CTCTACTG 
^ GAAATACCAT TCCAATTCTT TTTCTTACAG 

TAATAGTAAT GTCATCAACT GTAACTGTCC 
TTTGTATCAA CGTTGATTTA CCACTACCCG 

10 

GTTCAAATTC TGTATTAACA TCATGAATAG 
AGGTATAACT TACATTGTCA AACCGTATAG 
TAAGAATGAT GTTTGGTGTC CCAGCATTTG 

75 

ACCTATTCTT GTTAACTCTT CTGCATTGTC 
GACAGTCCCT TTATTCATAA CGATAACATG 
CGTAATAGAA ATGATTGTAA TATTATGTTC 

20 

ATTTTGACGT GCATCAGGAT CTAACATAGA 
GTTAAGTGCT AATACACTTG CTATAGCCAC 
25 AGGTTCATAA TCTGCACGTT CTAACATATC 

ATGCATTTCG TCATATGGAA CCGCATGATT 
AATTGAACCA ACAAATTGAT TATCCGGATT 
30 CTTTTCAAAA TTATCATCAG TTATAGCTTG 

TTTCTCTATG CCAATCATTA ACTTGGcAAT 
AATAGATGTC CACTGACCTT TAGGTATATT 
ATCACTTTGA TATTGAAATG AAACATTTTT 
TTGTCTCTCT CCTTTACGAT TCGTGTATCT 

» 

TATATGACAT TGACTGGGTT CTCTATATAT 

40 

TTAAAGTC3TT GTTTAACAAC TAATGATAAG 
AAACGTTAAT AAAATAAATG ATTTACTAAT 
ATACTTTCAC TTCATTCAGT TCTAGTGAAA 

45 

ATTCGCACTC AAAAAAGTAA ATATAAAGAA 
TCCGATATTT TATTCAATAA AAAAGCGCGC 
TTAAATCTTT ATTTAGTTGA TGGGGTACTC 
.ATTAtCGTTG CACTCATTTG CTTTATATAA 
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TGGCTTCATC TAAATTCATT TTAAAGTTTT 540 

TGTCCTCAAA TAATTGAGAT TCGGGAAATT SOO 

GTCTAATATA TTTATCTTTG GTCTTATGTG 660 

CAGTAGTCGG CTTTAACAGC GCATTAATAT 720 

TTTGTCCAAC GATGGCGTAA TATTTACCTT 780 

CTTGATGCTG ATATGGTGTC CCTTTTTGAT 840 

TCATAGTTGA TCCACCAGCC CTTCATAAGT 900 

ATTTATTTTG ATTGGGAATG GCAAATCTAG 960 

GAAAATTTCA GTCGCTGTGC CTTCTTTATA 1020 

ATCTGCTTCC ATCGCCTCAG ATAAATCATG 1080 

TGATTTAACT TTTCTCACTA AATCCAATAA 1140 

AGTCGCCTCA TCTAATATAA TGACAGAGGG 1200 

AOGCTGCTTC TGTCCCCCCG ATAATGCATT 1260 

AACTTGTTTA AGTGCTTCGC TGACTCTTCT .1320 

TTCGAGTCCA AATGCCACAT CGTATTTTAC 1380 

CTGAAATACA ATTCCTATGT CTTTTCrTAA 1440 

ATTATTATAA AAAATTTCTC CAGATTTAAC 1500 
TGTAGATTTT CCAGAACCGT TATGACCAAC ■ 1560 

AAAAGAAACA TCTTTCAATG TGAAGGATGC 1620 

AAATACAATA ACTGAATTCT TATCCTCCAC 1680 

ATCATATTTT ACAATATTTA TAAATCGCTG 1740 

TACTAGTATT TTCTGACTCA TTTCTAGTCT 1800 

GACTTTTATT CCTCTCTAAC AATTATGTAT 1860 

ATAGGGGTGG TCGCGTTTGA TTCAACGATA 1920 

TTGATCAAAC TAGCTTCATC ATATTTTTAG 1980 

ATCGGACTTA AAAACATTTC TGTTCATAAG 2040 

ACCCCATCAT AAGTTTGTTG AGTTCACGCT 2100 

TGAGCTAGAC AATATTTGTA TGTGGCAAAC 2160 

AAGTAGTTAG TGTATTTATA TAAATTCTTA 2220 
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ACGAGTGTAA CCACCTTGAC GTTCTGTGTA 
AAGTGCAGTT TGTGTAGTTT CATCTTCGTT 
^ TGCATTACGA CGAGAAGCTA AATCTCCTTT 

ACTGCGAACT TCTTTTGCAC GAGCTTCTGT 
TGTAGCTAAG TCACGTAACA TAGCTTTACG 

10 

ACCCATGAGT TAACCTCCTT TATCAATCTT 
ATTTGTATTT AACTTCTTCT AAAGATTTAC 
CTTCAGATTT GTCAGCTAAC TCTTGAACAG 

IS 

ATGAACGTAC AGATAAGTCT AATTCTTCAA 
CTTCTTCTTT TTCAATCATG ATTTCAGCGT 
TATTCAAGTG TTCAGTCATT ATTTTTGCTG 

20 

AACCATTAGT CCAAACATCC AATGTTAATT 
TATTTTCAAC AGTATAGTTC ACACGTTCAA 

2s CACCAATTGG TAAATCACTA GTATTATTTT 

TAGCAACTAG ACGAATTTTT AAGTGACCAC 
GGTTTAAAAT TTCAACATCA CTATCATGTG 

30 CACGTACATC AATTTCTAAA GTTTTATCTT 

TAATGTTCAT AATAATTGTA GAAACATCTT 
GTAAAACTCC CTCAATTTCA ATATACTTAA 
TACGACGTAA GGAGTTTCCT AGTGTAGTAC 
ACTTOCCGAA TTTAGCATCT TCACTAATTT 
CTATCATTTA AATATCCTCC TTATATACGT 

40 

CTGTAACAAT ACCATCATAA ATTATACACG 
AGGTACTGGA GTAACGTCTC TGATCGCAGT 
AATAGCTGAT TCACGACCTG GACCAGGTCC 

45 

ATGCTCCATA GCTGATTTAG ATGCAGTTTC 
TTTTTTAGAT CCTTTGAATC CTAATGCACC 
CTCATCAGTG ATAGTTACAA TAGTG7TGTT 

SO 

TTCAATATTC TTTTTCACTC TACGTTTACG 



AcGCTCTGCG ATTTCACCAA ATAATTTTTG 2340 

TAAGATTTCA ACATTACGTA AAGTTTTAGC 2400 

TTTACCTAAA GTGATTAATT TCTCAACAAC 24 SO 

AGTTTCAATA CGTTCACTAA TAATAAGTGA 2520 

TTGATCAGAA GTACGACCTA ATTTTCTGTA 25 BO 

CTTTTCTTAA TCCTAATCCT AAATCTTCTA 2640 

GACCTAAATT ACGCACTTTC ATCATGTCAG 2700 

AATTGATTCC TGCGCGTTTT AAGCAGTTAT 2760 

TAGACATTTC TAATACTTTT TCTTTTTGAT 2820 

TTTGCGCTTC ATCAGTAAGA CCAACGAAGA 2880 

CTAATGAAAC TGATTCTTGT GGTGTGATTG 2940 

TATCAAAATC ACTGCTTTGA CCTACACGTG 3000 

CAGGTGAATA CAATGAA7CA ACAGCGATTA 3060 

GTTCTGCTAA TGCGTAACCT CTACCCTTGT 3120 

CTTTAGATAC TCTTGCAAIT TTAAGCTCTG 3180 

TAATGTCGCT TGCTGTTACT TCGCCTTCAT 3240 

CTTCAGAGTA AATTTTCAAT GCTAATTGTT 3300 

CAACTACATT GTCTACTGCT GAGAATTCAT 3360 

cGGCTGCACC TGGTAATGAA GATAGTAGGA 3420 

CGTAGCCACG TTCTAGTGGT TCAACAACGA 3480 

CAATTGTCTC AATTCTAGGT TTTTCGATTT 3540 

CGACTTAATT TAAAATGTTT GCTCAGTGAC 3600 

ACGACGTTTT GGTGGACGAC AACCGTTATG 3660 

TACTTCTAAA CCTGCAGATT GTAATGCACG 3720 

TTTAACTGTT ACTTCAACTG TTTTTAAACC 3780 

AGAAGCCATT TGTGCTGCAA ATGGTGTTGA 3840 

AGCTGATGAC CATGATAAAG CATTACCGAA 3900 

GAATGTTGAA CGGATGTGTG CTACACCATT 3960 

AGATACTTGT TTACGTGCCA TTTAAAATTT 4020 
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CGCGCGTlcGT TTTTCGTTTT TTGACCACGA ACTGGTAAAC CACGACGGTG ACGGATACCc 4140 

ACGGTATGAT GAAATTnCCA TTAAAcGTTT GATAXTTAAG TTAGTTTCAC GACGTAAGTC 4200 

ACCTTCGACT TTATAACCGT CTACAACTTC ACGGATGCGA CCTAATTCGT CATCAGTTAA 4260 

ATCTTTCACA CGAGTATCAG CTGATACGTT AGCTTCTTCA AGAATTTTTT GAGCAGTTGA 4320 

CGTACCGATA CCGTATATAT AAGTTAATGA GATAACTACG CGTTTTTCAC GTGGAATATC 4380 

TACTCCTGCA ATACGTGCCA TATTAATTTA CACCTCTCTT TTATTAACCT TGTCTTTGTT 4440 

TGTGTTTTGG ATTTTCACAA ATTACCATTA CTTTACCTTT ACGTTTAATG ACTTTACATT 4500 

TTTCGCAAAT AGGTTTTACT GATGGTCTTA CTTTCATTTT TATACCTCCC TATATTATGG 4560 

AGTCACGATT ATTTATAACG ATAAGTAATT CTTCCGCGTG TTAAATCGTA CGGAGACATC 4620 

TCAACAGTTA CTTTGTCGCC AGGTAGAATA CGAATGTAAT TCATTCTGAT TTTACCACTT 4630 

20 ACGTGAGCnA AAATCTCATG ACCATTTTCT AATTCTACTT TAAACATTGC GTTCGGTAAA 4740 

GTATCTAATA CAGTACCTTC TAATTCAATT ACATCTTGTT TAGCCATTGA TTAACTTCCC 4800 

CCTTTTTGCA ATAGTAAGGT AATCGTCAAT AGACAACTTT ATTGTTACGA ATCTATCAGT 4860 

GATTAATTTT ATAAGTTAAA CAAAAATTAC GGGAATTAAT TATCGTTAAT TGCCACTCTC 4920 

ATCTATCTAA TATGATTAAA TCATGCCTCA CTTAAAATAG ACCGCTAAAA GTTGATCTAT 4980 

TACAAATGAT CTAAAATATC AATGACATCT TTGGTAACGT CGCTAATATC TTTTGAACCA 5040 

TCAATATTTT TCAATACACC TTTTTGATCA TAGAAATCTA AAATAGGCTT AGATTGTTTA 5100 

ATATTAACAC TCAAACGATT AGCTACCGTT TCAGGATTAT CATCTTCTCG TTGATACAAT 5160 

TTACCACCAT CGATATCACA AATACCTTCG ACTTCGGAGG ATTAAATACA AGATGATACG 5220 

TTGTACCACA TGACTCACAG ATTCGACGAC CTGTAAGACG GTTCATTAAT TCTTCTTCCG 5280 

GAACffTCGAT ATTGATGACA GCATCAATGT TTCTGTCAAG CTCAGACATA ATATTATTTA 5340 

40 ATGCCTCAGC TTGCTCGATT GTTCTTGGGA AGCCAXCTAA TAAAAAGCCT TTTTTTGCAT 5400 

CGTCTTCAGA AATTCTTTCC TTAACGATAC CTACAGTCAC TTCATCAGGA ACTAATTCGC 5460 

CACGGTCCAT ATAAGACTTA GCTTCTTTAC CTAATTCAGT TTCTTCTTTT ATAGCTTTTC 5520 

TGAACATGTC ACCAGTTGAA ATGTGGGGTA TTGGGAATTT CTTGaCAATT TCACTTGCTT 5580 

GAGTTCCTTT ACCTGCGCCA GGTAAACCCA TCAAAATGAT ATTCATAAGT GCCCTCCTAA 5640 

AATTATCTAC CACCAAAGCC TTTATATTCT TTTTGAGATA CTTGAGCTTC TAAAGATTTC 5700 

ATTGTTTCAA TCGCTACACC AATAACGATA AGTAAACTTG TACCACCAAT CTGAATTGAT 5760 

TGTGGTAATC CCATAAACTT AGTTGCTAAT ATCGGTAGAA TTGAAATAAC GGCTAAGAAG 5820 
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CCAGGTCTAA TACCTGGAAC ATAGCTACCT TGTTTCTTAA GGTTATCAGC CATTTTTTCC 5940 

GGATTAACTT GTACAAATGC ATAGAAGTAT GTGAATAGTA TAATTAGTAC AATATATACA 6000 

ACCATACCAA CATTACTTGA AGGATTTGCA GCATTCGCAA TGTTTTGTGC CCATTCTTTA SO 60 

TCTGGATAGA ACAACGTTAA TGTTCTAGGC AGTAAGAAGA ACGCCATTGC AAAGATTACA 6120 

GGAATAACAC CGGCTGAGTT CACTTTTAAA GGTAGATAAG TTGCCTGTGA ACCTAATCTT S180 

TGAGCAGTTT GTTTCTTAGC ATATTGAATC GGAATTTTAC GAACGGCTTC AAGTACATAA 6240 

ATAGCACCTA CAGTTAATAG TATCAGTGAC ACTAAAAGTC CTAATACTTT CAACCATGCT 6300 

AATGATGTAT CTTCTTGCCC AACGAACGCA tTTGTcCAAA TTGAATTAGA CTGGCTGGCA 6360 

ACGTTGATAA AATACCCGCA AATATGATAA TAGAAATACC ATTACCAACA CCGAACTGAG 6420 

TGATTTGATC ACCAAGCCAT ATTAAGAAAG CAGTTCCTGC TGTnCAAAAC TAGTGCTATT 6480 

20 AATAAATAAC TCATAATTGA CTGATTGATA ATCAGCGCAC CTTTGAGATA ATTATTAAAT 6540 

TGGAATGCCA TACCTATAGA TTGGATAAAT GCTAAAGAAA TTGCTAAATA ACGAGTAACG 6600 

TTATTTAACT TTCTTCTACC TACTTCACCT TGTTTTGCCC ATTCTGAGAA TTTAGGGACA 6660 

ATATCCATTT GTAATAATTG CATTACGATT " GATGCAGTGA TGTAGGGTAC AATACCCATT 6720 

GCAAAAATAG AAAATCGTTT CAAGGCTCCG CCACCAAAAG TATTTAATAA CTCAGTGGCA 6780 

CCTTGAGAAC CTTGGGGATT ATCAAAAGCT GCAGGATTTA CTCCTGGAGC TGGTATATAA 6 840 

GTCCCTATTT TAAAAATTAC TAACATTGCT AGTGTGAAGA AAATCTTGTT ACGAACCTCT 6900 

TTTGTTCTAA AGAAGTTCAC AAGGGTTTGA ATCATTAGAT CACCTCGTGT GcTCCACCTT 6960 

TAGCATCAAT AGCTTCTGCT GCTGAAGCTG AGAATTTATG AGCTTTCACT GTCAATTTCT 7020 

TATCAAGTGA ACCATTACCT AGTATTTTGA TACCAGATTT TTCATTCTTA ACAACACCAG 7080 

ATTCTACTAA TAAAGCTGGA GTTACrTCAG TACCATCTTC AAATTTATTA AGTTGGTCTA 7140 

40 AGTTAACAAT AGCATATTCT TTACGATTTA TGTTAGTAAA ACCACGTTTT GGTAAACGAC 7200 

GGAATAATGG TAATTGACCA CCTTCAAATC CTGGTCTTAC ACCACCGCCT GAACGAGCTT 7260 

TTTGACCTTT GTGTCCGCGA CCACTTGTTT TACCGTTACC TGTCGCAACA CCACGTCCAA 7320 

CACGATTGCG TTCTTTACGT GAACCTTCTG CCGGTTTTAA CTCATGTAAT TTCATTTCGG 7380 

CACCTCCTTG ATTATTTTTC TTCTACTGTT ACTAAGTGCT TAACTTTGTT GATTTGCCCA 7440 

CGAATAGCAG GGTTATCTTC AACAACTACT GAACTGTTAG TCTTTTTAAG ACCTAAAGCT 7500 

TCAACAGTTT TACGTTGTGT TTCAGGACGA CCAATAACAC TACGAGTGAG GGTAATTTGT 7560 

AATTTAGCCA TAACTAGTTT TCCCTCCTTA ATTGTATAAT TCTTCTACTG TTTTGCCACG 7620 
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CATGTTGATT GGTGTGTTTG ATCCTAATGA 
TTCAAGTACG GCACGAACAG GACCACCAGC 
CATAAATACG CTTCCTGAAC CGTAACGGCC 
ACGTGGAACA ACTACTAAAT CTTTTTTAGC 
TACCTCTTGA GCTTTACCAG TACCGAAACC 
TAATGCAGTG AAACGGAAAC GACGACCACC 
AACAACGCGT TCTTCAAATT CTTTCGTCTC 
CCTTTAAATT AAAATTCTAA TCCGCTTTCT 
CCGTGATATA AATATCCTCC ACGGTCAAAT 
TTTTTAGCAA TTGCTTCACC GACTTTAGTT 
ATGTCGCTGT CTTTTGAAGA AGCTTGAGCT 
TGAGCGTAGA TATGCTTGTT TGAACGATAT 
GATAAGTTAG TACGAACACG AGCATGTCTT 
CTGATCATTT CAATACTCCT TTCTTTAGAG 
TTACGGCGAA CGTATTCACC TTGGTAACGA 
CTTACTGAAC GGATGTTAGA TGCTAATGCT 
TTAACGACTG TGTTTTTCTC AACTGAGAAA 
GGGTGAGAAT AACCAACGTT AAGGATTAAG 
ACACCAACAA GTTCAAGTAC TTTTACGTAT 
AATAAAGCAC GAGTTGTACC ATGGTTTGTT 
ACTTeAATTG TGTTTTCrTC TTGTTTGAAT 
TCACCTTTAG GACCTTTAAC AGTTACATGA 
GGGATGTCAA TAATTTTCTT ACCAACACGA 
TACCAAACGT ATGCGATAAT TTCTCCACCA 
ATTACACCTT CAGAAGTTGA TACTAATGCA 
TCGCTAGCTT TTGCATAAAC ACGTAAACCT 
ACACGCTCAT CGTTTTGACC ATATTTTAAG 
TCTACGTATT CAACATTTTT AATGAAACCT 
TTAATATTTG ATGCAGGTAA TTCTAACTTC 
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TTTACTTAAG ATATCAGTGA TACCTGCTAA 
GATAACTCCr GTACCAGGTG CAGCCGGTTT 
AGTAATTGTG TGTGGAGTTG TACCTTCAAC 
TGCTTCAACA GCTTTTTTGA TTGCTTCTGG 
TACACGACCA TTTTTGTCTC CAACTACAAC 
TTTTACAACT TTTGCTACAC GGTTGATTGT 
TTCTTCtCTA CGAGCCATGT ATTTGTCCCT 
CTTGCTGCTT CAGCTAATGC TTTAAcACGT 
ACGATTTCTT TAATGCCTTT GTCAGCAGCT 
GCTAATTCAA CTTTAGTTGC TGTAGTAGCA 
AATGTTACGC CTTTATTATC ATCAATAATT 
ACGTTTAAAC GTGGCTTTTC AGCTGTACCT 
TTTAAACGCA CTTTATTTTT ATCAATTTTA 
TTTATCTATT ATTTACCAGT TTTACCTTCT 
ATACCTTTAC CTTTGTAAGG CTCTGGAGGT 
CCAACTTGTT CTTTTGAAAT ACCTTCAACT 
GTAATGTTTT CTTCAGCTTT AATTTCTACT 
TCTTTACCTT GCATTTGAGC ACGGTAACCT 
CCTTGAGAAA CACCTTGTAC CATATTGTTT 
CTATCTTCTT TAGAATCAGA TGGTCTTACA 
GTCATTCTTT CATTTAAAGT TCTTGATAAT 
TTTCCATCAA AAGTTACTGT TACGTCACTA 
CTCATGTTAT GGCACCTCCT TATTTTTTAT 
ACATTACGTT TTCTTGCTTC TTTGTCAGTG 
ATACCTAAAC CATTTAATAC TTTAGGCATT 
GGTTTXGAAA TACGTTTTAA TCCTGTGATA 
AATAAACGAA GTACACCTTG TTTATCATCT 
TCACTCTTTA AGATTTCAGC AATTTCTTTT 
TCGTGACGCA CCATGTTTGC GTTTCTTACA 
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TCTTTTTTAT TACCAGCTAG CTTTACGAAC GCCAGGGATT TGGCCTTTGT AAGCTAATTC 
ACGGAAACAA ATACGGCATA ATTTAAATTT ACGATATACA GAATGTGGAC GGCCACAACG 
TTCACAACGA GTGTATTCAC GAACTGCATA TTTTTGTTTT TTTTGTTGCT TAGCAACCAT 
TGAAGTTTTA GCCACTTAAT TAGCCTCCTT TAAATAATTA TTTACGGAAT GGCATACCGA 
AGTTAGCTAA CAATTCACGA GCTTCTTCAT CAGTGTTAGC AGTCGTTACG ATAACAATAT 
CCATTCCTCT AACTTTACTT ACTTTATCAT AGTCGATTTC TGGGAAAATT AATTGTTCTT 
TAACACCTAA AGTGTAGTTA CCGCGTCCGT CAAATGCTTT TTTAGAAACA CCTTGGAAGT 
CACGTACACG TGGTaATGAT ACTGAAArTA ATTTGTCTAA GAATTCATAC ATTCTTTCAC 
CGCGAAGTGT TACTTTCGCA CCGATTGGCA TACCTTCACG TAAACGGAAA GTCGCGATTG 
aTTTTTTAGC TTTAGTTACT AATGGtTTTT GACCAGTGAT CAATTCTAAT TCTTCAACAG 
CATTGTCTAA TACTTTAGAA TTTTGTACTG CGTCACCTAC ACCCATGTTC ACAACGATTT 
TATCTATTTT TGGTACTTCC ATTACTGAAC TATAATTGAA TTTTTTCATT AAGTTTTCAG 
TAACTTCAGT GTTaAACTTT TCtTTTaAAC GGTTCeUWST GGGATCCTCC TTTCaACTTG 
TtATTAATTA TTAGAkTTAA TTTCTTCGCC AGATTTTTTA GCGATACGAA CTTTTTTACC 
ATCAACAAAT TTGTAACCTA CACGAGTTGG TTCGTTTGTT TTAGGGTCCA ATAATTGTAC 
ATTAGAAACA TCGATTGCTG CCTCTGTTTC TAAGATTCCA CCTTCAGGAT TTAATTGAGT 
TGGTTTTTGG TGTTTTTTCA TAATGTTAAC ACCTTCCACA ACGACACGGT CTTTTTTAGG 
TAGAGTAGCA ATTACTTTAC CTTCTTTACC TTTGTCTTTA CCTGCGATAA CTTTAACGTT 
GTCACCTTTT TTGATATGCA TGTGGGCACC TCCTTATTTG TATTGGTTGT TATTAATTAA 
AGTACTTCTG GTGCTAATGA. TACGATTTTC ATGAAGTTAC CTTCACGTAA TTCACGAGCA 
ACAQ5TCCGA AGATACGAGT ACCACGTGGO CCTTTGTCAT CACGGATGAT AACACATGCA 
TTTTCATCAA ATTTGATGTA TGAACCGTCA TTACGACGAA CACCTGACTT AGTACGTACG 
ATTACAGCTT TGACAACGTC ACCTTTTTTA ACAACGCCAC CTGGTGTTGC ATTTTTAACA 
GTACATACGA TAACATCGCC GATGTTTGCT GTTTTACGAC CAGATCCACC TAATACTTTG 
ATTGTAAGAA CTTCACGAGC ACCAGAGTTG TCTGCTACTT TCAAGCGTGT TTCTTGTTGG 
ATCATTAGTT AAACCTCCCT TATCTCTAAA CTTGTATTAA ATAATTACTG ACTCTTCAAC 
AATCTCTACT AAACGAAAAC GTTTTGTTGC TGATAAAGGA CGAGTTTCTT GAATTTTAAC 
AATGTCTCCT AATTTAGCTG AATTGTTTTC ATCATGAGTT TTGTATTTTT TAGAGTATTT 
TACTCGTTTA CCGTATAATT TGTGTGTTTT GTAAGTTTCA ACAAGTACTG TAATAGTCTT 
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TTTTGTAACC TCCTCTTACT TAATTATTGA TTAGCCTTAC TTTGTTCAAT TTCTCTTTCA 11340 

CGAGCAACAG TTTTTAGACG TGCAATCGTT TTTCTTACTG TACGAATACG TGCAGTTTCT 11400 

TCTAATTGAC CTGTAGCTAA CTGAAAGCGT AGGTTAAAAA GCTCTTCTTT TGAAGATTTG 11460 

ATTTGTTCTT CGATTTCTGA AGTGGTTAAG TCTCTAATTT CCTTAGCTTT CATTTGTTTC 11520 

ACCACCCAAT TCCTCACGTT TTACAAACTT AGTTTTTACT GGAAGTTTGT GACTTGCTAA 11580 

ACGTAGTGcT TCACGCGCAA CTTCTTCAGA AACGCCAGCA ACTTCGAATA AAATTCTACC 11640 

TGGTTTAACA ACTGCGATCC AGCCTTCAAC CGCACCTTTA CCAGCACCCA TACGTACTTC 11700 

TAAAGGTTTT TTAGTATATG GTGTATGTGG GAAGATTTTA ATCCAAACTT TCCCGCCACG 11760 

TTTCATGTAA CGTGTCATTG CTATACGAGC AGATTCX5ATT TGACGAGATG TGATCCAAGA . 11S20 

CGTTGTTGTA GCTTGTAAAC CAAACTCACC AAATGtTACG TAtTACCGCC TTTAGAACGA 11980 

CCAGTTGTTT TAGGACGATG TTGACGACGA TATTTTACAC GTTTTGGTAG TAACATTATT 11940 

ATTTTCCTCC TCCACTAGTG TTCTTAGTAG GAAGAACTTC TCCACGATAA ATCCATACTT 12000 

TAACGCCTAA TTTACCGTAA GTAGTGTCAG CTTCAGCGTG tGCATAATCG ATGTCAGCAC 12 060 

25 GTAACGTATG AAGTGGAACA GTTCCTTCTG AATATTGTTC AGCACGAGCG ATGTCAGCTC 12120 

CGCCTAAACG ACCAGATACT TGaGTTTTGA TACCTTTAGC ACCAAGTTTC ATAGCTCTAG 12180 

TGATTGCTTG TTTTTGTACA CGACGGAATG AAGCACGGTT TTCTAATTGA CGTGCGATGT 12240 

TTTCAGCTAC TAAACGAGCG TCAAGATCAA CTTTTTTGAT TTCAATTACG TTGATGTGTA 12300 

CTTTTTTATC AGTTAACGCA TTTAATTTGT TGCGTAATTT TTCGATTTCT GAACCGCCTT 12360 

TACCAATTAC CATACCAGGT TTACCAGTAT GAATTGCAAT GTTGATACGG TTTGCAGCAC 12420 

GTTCAATCTC TACGTGAGAA ACTGATGCTT CTTTTAATTC ATTATCAATA AATTTACGGA 12480 

TTTTTAAATC TTCGTGTAAA AGTGAAGCGA AGTCTTTTTC AGCATACCAT TTAGCTTCCC 12540 

AATCACGGAT AATACCAACA CGAAGTCCGA TTGGATTAAT TTTTTGACCC ACAGTAtTCC 12600 

CrCCTTAAAA GTTAATTAAG CTTCTTTAGC TTCTTCTTTA CCGTCACTTA CGACGATTGT 12660 

AATGTGGCTT GTACGTTTGT TAATCGCACT TGCACGACCT TGCGCACGTG GACGGAAACG 12720 

45 TTTTAATGTT GGTCCTTCGT TAGCATATGC TTCTTTAACT ACTAATTCAT CTGTGTTCAT 12780 

GTCATAGTTA TGTTCAGCAT TAGCTAAAGC GGACATTAAT ACTTTTTCAA TTACTGGTGA 12840 

TGAAGCTTTG TTTGTTAATT TTAAAATTGC AATAGCTTCA GCAGCATTTT TACCTCTGAT 12900 

TAAGTCAAGA ACTAGTCTTA CTTTACGAGG TGCGATTCTT ATTGTTCTAG CAACCGCTTT 12960 

TGCTTCCATT AGGATGTCCT CCTCTACTTA ATAGATATTA TCTTCTTGTT TTCTTGTCGT 13020 
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TATCTTCAGT TACATATACA GGTACGTGTT TACGTCCGTC GTATACTGCA AAAGTATGTC 13140 

CGATGAAATT AGGGAAAATT GTAGAACX3AC GTGACCATGT TTTGATTACT TGTTTCTTTT 13200 

CGCTTCCTTC TTGAGCTTCA ACTTTTTTCA TTAAATGCTC ATCGACGAAA GGTCCTTTTT 13260 

TAATACTACG AGCCATTTGG GCGCCTCCCT TCTTATTATG TGCGTGCAGC TTTAAGCCGC 13 320 

ACACCCAAAT AAGTTGATTA TATTATTTTT TCTTACGTCC ACGAACGATA AGTTTGTCTG 13380 

ATGATTTTTT ACCACGACGA GTTTTCTTAC CAAGCGTAGG TTTACCCCAT GGTGACATTG 13440 

GAGATGGTCT ACCGATAGGA GCACGACCTT CACCACCACC GTGTGGGTGA TCGTTAGGGT 13500 

TCATTACAGA ACCACGAACT GTTGGACGGA TACCTTTCCA TCTTGAACGT CCGGCTTTAC 13560 

CAACGTTAAC TAATTCGTGT TGTAGGTTAC CAACTTGACC GATTGTAGCA CGGCAAGTAG 13620 

ATAAGATCAT ACGAACTTCA CCAGATCTTA ATCTGATTAA TACGTATTTA CCTTCTTTAC 13680 

CAAGTACTTG AGCACTTGCA CCAGCTGAAC GAGCGATTTG TCCACCTTTA CCAGGTTTAA 13740 

GCTCGATGTT GTGTACTACT GTACCAACTG GAATGTTTTG TAATGGTAAT GCGTTACCAA 13800 

CTTTGATGTC AGCTTCAGCA CCACTTTCAA CGATTTGACC TACTTCTAAT CCTTTAGGAG 13860 

CAATGATATA TCGTTTTTCA CCGTCTGCAT ATACAACTAA AGCGATGTTT GCTGAGCGGT 13920 

TTGGATCATA TTGAATAGAA TCAACTTTTG CATTGATACC ATCTTTGTTA CGTTTGAAAT 13980 

CGATAACACG GTATTGACGT TTGTGTCCAC CACCATGGTG TCTTACAGTC AATTTACCTT 14040 

GGTTGTTACG TCCCGCTTTT TTCGGTAGCG GTTTTAATAA TGACTTTTCA GGTGTAGTTT 14100 

TCGTGATTTC TGCGAAATCT AACGAaGTCA TATTACGACG ACCATTTGTT ATTGGCTTAT 14160 

ACTTTTTAAT AGCCATTGTC GCTTACCTCC TTAATGGTAA TTGTTTTATT AGTTAAATAA 14220 

GTCGATTGAT CCTTCTTTAA GAGTTACAAT CGCTTTTCTT CTTTTGTTTG TATAGCCTTG 14280 

GTAACGGCCC ATACGTTTTT TCTTAGGTTT GTAATTCATG ATATTAACAC TTGCAACTTT 14340 

TACGTTGAAG ATTTCTTCAA CTGCCATTTT TACTTGTGTT TTGTTAACAC GAGTATCAAC 14400 

GTCGAAAGTG TATTTGTCTT CAGCCATTGC TTCAGAAGAT TTCTCAGTGA TTACGGGGCG 14460 

CTTAAGAATA TCTCTTGCTT CCATTATCCG AGCACCTCCT CAACTTTTTT AGCAGCAGCT 14520 

TCAGTAATTA CTAAGCTGTC AGCATTAGTG ATATCTAAAA CATTTAAACC TTGAGCAGTT 14530 

GTCACTTGAA CGCCAGGGAT GTTGCGTGCT GATAATTCAA CATTTACATC TTCGTTTTCA 14640 

GTAACTACTA ATACTTTTTT AGGTTGTTCT AATGTAGATA ATACATTTTT GAATTCTTTA 14700 

GTTTTTGGAG CTTCGAAGTT GAATGCGTCA ACTACAGTTA AGCCATTGTC TTGAGCTTTG 14760 

AAAGATAATG CTGAGCGTAA AGCTAAACGA CGCATTTTCT TAGGCATTTT GTATGCATAA 14820 
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CCTTGACGAG CACGACCTGT TCCTTTTTGC TTCCATGGTT TACGTCCGCC ACCGCTTACT 14940 

GCTGAACGAT TCTTAACAGC ATGCGTACCT TGACGTAATG AAGCACGTTG TAAATTAATA 15000 

GCTTCGAATA AAACGCTATT ATTTGGCTCA ATACCGAATA CTGCATCGCT TAATTCGATT 150S0 

GAACCTGATT TAGTTCCGTC TAATTTTAAA ACATCATAAT TAGCCATTAT GCATTTCCTC 1S120 

CTTTCACTTC TTATTATTTA TTACCTTTTT TAATTGAAGT TCTGATTTCT ACTAAACCTT 15180 

TTTTAGGTCC AGGTACGTTA CCTTTTACTA AGATAACTTT GTTTTCTGTG TCAACTTGAA 15240 

CTACTTCTAA GTTTTGAACA GTTACAGTGT TTCCACCCAT ACGTCCTGGC ATTTTTTGGC 15300 

CTTTAAATAC TCTAGAAGCA TCTGAAGCCA TACCTACAGA ACCTGGTGCT CTGTGGAAAT 15350 

GAGAACCGTG TGACATAGGT CCACGAGATT GTCCGTGGCX3 TTTAATTGCA CCTTGGAAAC 15420 

CTTTACCTTT TGATACGCCT GTTACGTCAA TAACGTCGCC AGCTACAAAA GTATCTACTG 15480 

AGACTTCTTG AaCCTAcTcG TAAGCATCCA CGTCTACATT GCGGAATTCA CGAATGAAGC 15540 

GCTTAGGTGC TGCGTCAGCT TTTTTAGCGT GACCTTCAGC TGGTTTATTA GCATATTTAT 15600 

TAGATTTTCC AT CT TTTTT G TATGCTTTTT TGTCTTCAAA TCCAACTTGG ATTGCGTTGT 156S0 

ATCCATCAAC TTCTACAGTT TTCTTTTGTA ATACAACATT TTCTTTAGCT TCTACTACTG 15720 

TTACAGGGAT TAATTCACCG TTTTCTCCGA ATACTTGTGT CATCCCAATT TTTCTTCCTA 15780 

AGATTCCTTT GGTCATCGAA AGTCCACCTC CTAAAATTGT CTATTATAAT TTGATTTCGA 15840 

TGTCTACACC AGATGGTAAG TTTAAGCCCA TTAAAGCGTC AACTGTTTTT GGTGTTGGGT 15900 

TTACAATATC GATTAAACGT TTGTGTGTAC GTTGTTCGAA TTGTTCACGT GAATCTTTAT 15950 

ACTTATGCAC GGCACGGATG ATTGTGTAAA CTGATTTCTC AGTTGGTAAC GGAATTGGTC 15020 

CAGAAACATC TGCACCAGAA CGTTTCGCTG TTTCTACAAT CTTCTCTGCT GATTGATCAA 16090 

TTACGCGGTG ATCATAAGCT TTTAATCTGA TTCTGATTTT TTGTTTTGCC ATAATTTTCC 16140 

CTCCTTATTC GTCTACATTT AGTGATAGAC TTCTCCACGA AAACTATCTT ACACAGCGCC 15200 

ATGGCAAAGC GGCCGGGTGT GTCAGTAACC TTTCGCTTCA TCGCTTTTCT TAAAGTCCAA 16250 

CGTTAGTTAT ATTACACGAA AAACATCGAT AAATCAAGGC TTTTCACATA ATTTTTCTAT 16320 

CTGTCTAACA CATACTTTTA TATTTnACTT TATATACTTA GTCAGTTCAA CTATTTTCGA 16380 

GATATTTTnA ATTTCCn 16397 
(2) INFORMATION FOR SEQ ID NO: 206: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 29555 base pairs 

(B) TYPE: nucleic acid 

<C) STRANDEDNESS: double 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 206; 

TnAGTTGTTT CTGCCACGAA AGATTCAATG GCTTTTCTTG CTTTACGCTT TTCTTT.CAAT 60 

GGCAAATCAC CAATCATTTT TTTAAGGTGA TGTGGGTTTA CAACACCACT ATACTGGTAG 120 

TCATTTGAAn XTGTTTTTAG GGCTTGTTCA TCGATAGATC TCTCTCCAGC AAATCCTTTG 180 

AACTCCGCTT CTTTTTTAAT ACTTTCGAAA TTAACATATT CTTGATCGAT ATCATCATCC 240 

TTATTTAAAG AAGGTACAAC ATTGTCGATG AATTCTCTAA TTAGATCTCG TTTTAACCTC 300 

AATGtCGGAT CATCTGCATG ATCTAAAATG CGTCTAATTT GTTCTTGGTT ACGACGTTGT 360 

TCCGCTTTGT CTTCAAGATC AATTTGTCTC AATATATTCA TAATATAATT CACATTAATC 420 

GTATCATTAC .GCATCATTTC TATTTCGAAA TCAATATCAT TTAAAATGGA TACTTTATTT 480 

20 TTCTCAGCCG TCGCTCTTTT TACTTGATCG TACACAGCTA AATATTTACT TTTATAGTCT 540 

TCATTCTCTT GTTCATCCAT TCCAATTTCA TCAATTGTAA ACTCAAACTC GTCAAATGCT 600 

TTTAAACGTA ATATTATTTT AGCTAATAAA CGATAAGCtT CAACAAAGCG CTTTAGCTCT 660 

TCTTCATCtT GaATGtCATC AACCATGTGT GGTGTCGGCA* CAATCATTTT AAGCTCACGA 720 

TAAGCGTCCA TAAATTCTTT TTTATAGTCT TCATAACTGC GCATTAAAAT TGTATCCGTA 780 

TCATTTGTTT GTGAGAATAC TCTCAGTGCA TCGTCTGTCT CTTTTTTCAA GTCACGATAG 840 

TTTACAATTT TACCAAATGG CTTTGATTCT TTTTCAACCC TATTTGTACG TGAATACGCT 900 

TGAATTAAAT CATGATACAT TAAATTCTTA TCAACATATA AAGTGTTCAG TACTTTACTA 960 

TCAAAACCAG TTAAGAACAT ATTAACAACG ATTAAGATAT CAATTTTACT ATCTTTAACG 1020 

CCCTTTTTAA CGTTTTTtGA AATATGATTA AAATACTCAT TAGTTGtGGC TGnTGaAAAA 1080 

TTCGTCTCGA ACTTTTTATT ATAATCACTA ATCATTATCT CTAATTTTTC ACGTGAATGA 1140 

40 TATGGCACTT CACCATCACG ATCATCTTCA TTAGGTTTAA ACGTAAATAT ACCAGCTATC 1200 

GTTAACGGTT GTTCCAACTT TTTGTTAAGT CGCTTAAATG TCTCATAATA TTTAATAAGC 1260 

GCGTGAATAC TTTGGACTGT AAATATACTT GAATATTGAC GATTACGTGT ATATTTATCA 1320 

TGATTATTGA TGATATGTCG TGTTACTAAT TCCACACGTT TATCCGCTAA CCATACTTCT 1380 

TCCGTATCAA TTGCTTCAAC CATGCtGTTA TCTTCTGCTT TTAAAGCTTT ATTTTTAAAA 1440 

GTATTAATAT AGTCAACTGA GAAACCAAGT ACATTACCAT CATGAATGGC ATCTCTAATT 1500 

AAATACGTAT GTAAGCATCT ACCGAAAATA TCTGCAGTTG XTCTACCATC TTGACTACTA 1560 

.TTTTCTGGAA AACGTGGCGT ACCAGTGAAT CCAAAGTATT GGGCATTTTT GAAATGTTGT 1620 
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ACTTTATTCG TTTTATACTG TTCTAATAAA GGGGCATTCC CTTGAATCGC TTTAGCCATT 1740 

TTTTGAATCG TCGTTACAAT AAGTGGCAAA CTTTTATCAT TTAGTTGGCG TACCAGTTGC 1800 

GAGGTATTAA AAGTTTTGTC TACAGCACCC TTAGCAAATT TATTAAATTC CTCTTCTGTT 1B60 

TGACTATCCA AGTCTTTACG GTCAACCAAA AAGATAACTT TCTTAATGTC ATCTTGCTGT 1920 

GATAAAATCT GACTCGCTTT AAAAGAAGTC AACGTCTTAC CACTTCCAGT TGTATGCCAT 1980 

ACATATCCAT TATTCCCTGT CTCAGTCGCT TGTTGAATAA GTGCTTCTAC CGCATACACT 2040 

TGATACGGAC GCATTGCCAT CAGTATTCTA TCXGTTTCAT TAATAATCAT ATAGCGCGAT 2100 

ATCATCTTAG CTAATTGACA AGGTCTCATA AATGACTCAG CAAACGATTG CAATGTATTG 2160 

ATACGGTTAT TCTGTTTATC ACTCCAATAA AACATGTGAC TCTTCAATAG TTCGCTATCA 2220 

TTATTAGAAA AGTATCGCGT TTCAACACCA TTACTAATGA TAAACATTTG TATGTAGCGG 22S0 

AATAAGCCTG TGTAATTTTG TTTGCGGTAA CGTTTTACTT GGTTAAACGC CTCATTAATA 2340 

TCAATACCTC GACGTTTCAA TTCAACTTGG ACAAGGGGTA GTCCGTTGAT TAATATCGTT 2400 

ACATCATAAC GTGCTTTATA TGTATCCTCG ACAGATACTT GATTCGTCAC TTGAAACTTA 2450 

25 TTTTTACACC AACTTTTCGT ATCTAAAAAC GACAAATAAA TCTCAGACTC ATCATCACGT 2520 

CTAAGTGGTA ATTTATCACG TAAAATACGG GCACTCTCGA AAATACTTTT TCCATCAATC 2530 

ATCGTTAACA GACGTTGaAA TTCTTTATCT GTTAaGGGAT TGCCTTCTAA TTTGTCCX5CA 2S40 

TGACGCTCAT TTAAAATCGT TCTAAAATTA TCAAGCAATT GCTTATTATC ACGTATCGTT 2700 

ACTCTTTCGT AACCCAATTG TTCAAGTTGA TTCATCATTT CATTTTCTAA TGCGTATTCA 2760 

CTTTGGTATG CCATTCATAT CCCCTTCCAT ACACTTTCTA TTGCTCTAAA TATATCATAA 2820 

ACTTTAATGA AAAATGTTTG TTTTTTATCT TCAAACGTAA ATTTATTCTA ATTTTATTGT' 2880 

CTTATCTTTT AATATTTGTC TTTGAGGTAA GTCGTATACT AAAATTTGAA TACAAATAAT 2940 

CAAATCATTG ATAAATTTTT TGTCTACGAT TAATGGAGGG ACTTGAATGG TGTTAATTAC 3000 

CTATCAAATC ATTTTATTTT TTATTATTAG TCTAAGTTAC TATTTAACTT TAAATCATTA 3060 

CATGGCAGTC ACTGTAGGTA ACTTCACTTC AATATTCGGC ATGTTCGCAG CCATACTCTT 3120 

45 TATGTACTAC TACCTACTCT ATAAAAGTCC CGAATACAAT CAACGCAAAC GATTTAAACA 3180 

TTTCATTCAT ATCACTAATT TGATAATAAT TGCTTTTAGC ACCTTCGTAT TAGTTCATTT 3240 

AGCATTAAAA TTATTCTTCA GCATTTAATT TCCATCTATG AAAAAAGCAA AGCTCAAATC 3300 

TGAACTTTGC TTTAATTTGT CACGCCTTTA TCATTTTCAA AATAGCCTCT ATGCCAGTTT 3360 

TACAAACTTG TAGCAACAAT TTTTCATCAA GCAACTGAAT CACATCAAAA ACTTCAATTG 3420 
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GTCGCAAGAT GCTTCCTGTA ATTATCAAGT GCCATTTTCG ATTGGGTTAT ACAATCTAGA 3540 

ATCGCATGAT AATTTAATGC TACAAATCGA TAGTACAATA TATCTACCGT GAATAACTGT 3600 

GCAAATAGTG ACGTTGTAGC CGCCATACGC ATTTCATTTT CATCAGTTCT GCCATAAATC 36S0 

AATGCATAGT CTGCAATTTG AGCCACTGGA TTATTAGCTG TACTAGATAT AGTTATGATG 3720 

GGAATACTGT AATGTGTGGC CACCTGTGCA ATTGACTGGA ATTCACTATG ACTACCTTGA 3730 

TTCGTCACAA AAATCATGCA ATCTCTATCA TCATGCGTCG CAAATGTTGA CACAAGTAAA 3840 

TGCGTTTCAT GTAATAACCT GACATTTAAG CCAATACGAG ATAACTTTTG AAAAAGATCA 3900 

CCAATAGTCA AACTCGATGC GCCAAATCCA AATAAAAATA TTGTCCTGGc ATTTTTCAAC 3960 

ACATCACAAA TTGCATCAAT TTGCGCATCC ATAATATTAG TAGCTACAAA TCGCATCGTA 4020 

TTCGTTGCTC TAGCAATCAT TTTATTTTTC AAAGTTTCTA CAGATTCATT TTCAATCAAT 4080 

20 TCTAAATGTG GATTGGTTGC AATATCTTCG GGTAAGTATC GAGATATCGC AATCTTTAGC 4140 

TCTTGAAAAC CTTGATGTGT CATTTTCCGA CTAAATCTAA CAATTGATGC TGTACTAACA 4200 

TTCGTAACAT CTGCCAAATC ATTCACAGTC ATATCAATGA TTTTATGTGG ATTCTTTAAA 4260 

ATGTAATCAG CGATTATCTT TTCTGTCTTC GTAAAATCAC TCAACTGCTT ATCAATGCGA 4320 

TATAAAATAT TTGTCATCAT TAATCACCCA ACAAATCTGT CTGTCGCATC GCCTTTGTCG 4380 

TTCCAAATAA ATATGTACAA ACGAATCCAC CAGCATACGC AGCAAGTAAT CCTGCAATAT 4440 

AACCTAAATA CATATTATCT GAGATTAATG GTAATAGTGA CACACCACTT GGGCCTATTG 4500 

CTTTGGCACC AATATGTCCA ATTCCACCTA TTACAGCGCC ACCAATACCA CCACCAATAC 4560 

AAGCAGTTAA GAAAGGTCGA CCTAATGGCA AAGTCACACC ATAGATTAAT GGTTCTCCGA 4620 

TACCTAGGAA ACCAACTGGC AATGCACCTT TTAAAGTATT ACGTAATGTT GTGTTGCGTT 4 6 BO 

TACATCTTAC CCAAAGTGCT AATGCGGCAC CTACTTGTCC AGCACCAGCC ATCGCTGCAA 4740 

40 TTGGCAATAA GTAAGTAGCA CCTGATTGGT TAATCATTTC TATATGAATT GGCGTAAAAA 4800 

TATGATGAAG CCCTAACATA ACTAACGGTA GGAAGCTTGC ACCAATGATA AATCCACTAA 4860 

ATACGCCACC AATACTAATA ATTCCGTTAA CTACTGAAAC. TAAACTGTCT GAAACAAAAC 4920 

CTGCTAATGG CATAAAGATA AAGATAGTTA ATAGTCCTAC AATCAACAAT GCAATAGTCG 4950 

GCGTTACAAT AATATCAATC GCATTTGGCA CAATTTTATG TAATCTCTTT TCGACAATAC 5040 

TTAAAATCCA AACGGCAAAA ATAACGCCAA TAATCCCACC TTGTCCAGGT TGCAATGGTT 5100 

CTCCAGTGAA GACATTCATT AAAATATTTT TACCAGCAAT ACCCGTTAAT AACGTTGTAC 5160 

CACCAATCAC GCCACCAAGT CCTGGTGTCG CACCAAATTC TTTAGCCGCA TTAATACCAG 5220 
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GCGTAATCCA AGCACCTGAA ATATAGCCTG CCACCATTAA GTTACTCAGT ACTGCTGCAA 
TACCACCAAT TAATCCAGCT CCAATAAATG CAGGAATCAA CGGTATAAAG ATATTGGCAA 
TTGATTTCAA TACTTTATTC AACTTACCAT TCTTTTGTTT TGCTTTATGC GCTTCCTTAT 
TCGCCTTTGC TTTATCAGCT GCATATGATT TATAGTCCAT TTTTTCACTA TCATTGTGAT 
GGTGTGGTAT TGGGTCACCT AGTTTAACAC CACTTAATTC CGCCATATGA TTAGCCACTT 
TATTGatGTA CCAGGTCCAA CCACAACTTG AATGCGTTCA TCGTGTATAA CACCCATGAC 
ACCATCAATA TGCCTTAGTT CTTGGTCATC TACTTTATTC TCATCTAATA CTTTAATACG 
CACACGTGTC ATACAGTTCA TGACACTATC TATATTATCC ATACCACCTA CTGCAGCAAT 
AATTCGTTCT GCAAGTTGTT GTTCTTTGGT CATTTAAATC CCTCCTAAGG TTGTCTATCT 
CTGATTGCTC GTTTAAaATG TCACCATTGT TTAATAACCG TCTTGTTGCT TCTTCCTTAG 
AAATGCCACA CATACCCATA ACTGTCGCAA CTTTCACATC ATGCTCAGAT ACCTGATATA 
ACGCCATTGC TTCATCATAT GTGATAGCAC ATATTTCTTG AATAATACGC ACTGAACGGT 
CGATCAGTTT TTGATTGGTT GCTTTAACAT CAATCATGAG GTTATCGTAA ACTTTTCCGA 
CACCAACCAT TGTGATGGTT GAAATCATAT TTAAAATTAA CTTTTGTGCt GTACCAGACT 
TTAAACGTGT TGAACCAGTT AATACTTCTG GACCAACTTT AACTTCTACT GGATAcTGCG 
CAATTTCACT TATAACTGCA TGTTCATTGC ATGAAATAGA TACTGTTGTA GCACC6ATTG 
TGTTAGCAAA TGTTAAACCG CCTATAACAT ATGGCGTTTT GCCACTCGCG GCAATTCCTA 
TAACGACATC TTTTGATGTT AAATCTATAT TTTTCAAATC TTCTTCCGCT AATTTTTTGT 
GATCTTCCGC ACCTTCTACA GCCATCGTCA TAGCATGTTG TCCACCAGCA ATAATACCTA 
TAATTTCATG AGGGTCAGTA TTGAATGTAG GTACACACTC CGCTGCATCT AAGACACCCA 
ACCTTCCACT TGTACCTGCA CCGATATAAA TCAATCGTCC ACCCTTTTTA TACTGTGCAA 
TTGTTTTTTT AATTACTTTT GTCAATTGTG GTATTGCCTT TCGAACTGCT AACGGGACrr 
GCTGATCTTC TTTATTCATC GTAATTAAAG CCTCTTCCAC AGTCATTTCA TCAAGATGCA 
TCGTCGCTTC ATTACGCGCT TCGGTCGTAC TATTTTCCAT CACTTCTTAC ACTCCCTAGT 
TTTTTGAAAA TCAAATGTAT CATTCGGCTC GATACAACTT AACAGTGGTA AGTCTTCTTT 
AATAATTTGT GCAaCAACAT TCACATTGTC ATGTGCACTA AGCGTTTGTC TCACAATTTG 
CATTTCGCCT TGATAACGTC CGTTATTCAA ATTATCAACG GTTACTGAAC CAATGCGTCG 
TTGCGTCGTA AACTGTGGTT GAATCGAATG TGGACATATT TGTCTTGACG TTTCCGAACG 
AATGACATTT TCCGGATTAT CCGGGCGTAC TTTATGACAC ATATCGAAAA GGTAAGTCAC 
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AAGTTGTTTT GCCTGCCTCA TTTCAATCAA 
AGTTTCTTGT AATAATTTAG CTGCAACGAC 
^ TGGCAAGCC7 TTATGCAAAG GACCTCGCAA 

TGCCTTTGGA TTAAATTGAT AAATGAGTTC 
TCCCGTATCT GGTCTTGGAT AATAGTTATG 

10 

TTGTTGATGT AAGCTTGTTA ACAATTCCCG 
TAAACCCTGT GCCATTATCG CTTCGATTGC 
CATAAATTGT GCATCATATT GTCGAAGATG 

75 

ATTAGCATCT ATGAGGTAAG TCACTTGTTC 
ATAATGATAT TTTGTCTCGT CATCTTCTTC 
20 GTAACCTTGT TTAATCATTC GCTTAATATA 

TGAAAAGCCT GTCAAAGTAG CCCTCCTTAA 
TTGTGTAATC GCTTACATTT TACTATAAGA 

2S 

GCCTGTTCAT TGTAATAATC TTACATATTT 
GATTATCCTT TCTTTTAAGT GCTGATAATA 
TTATACATTT TATTCAGGAT TATCTTATAT 

30 

AGAGATTTGA AATTGAATTT AATAATTGTA 
AGGAGTCGCA AACAAATAAG ATTCAATAAG 
TCGTGTCTTT TTTTATTGAA TCTTAAATAA 

35 

GGAAGAAACT TTTCGGTCAA TTGCAACGTA 
TTTI^CCAGC AGCTGGTCTG TTATTAGCTA 
40 AACACTACTT GCCGTTTATA CAAAATGGTG 
GTGCTGGTGG TATCATTTTT GATAACTTGC 

GATTAGCTGG CGGTGATGGC GTAgcAGCTA 

45 

ACAAAACAAT GGGCGACTTT TTACAAGTTA 

GTTACGCTAG CATTTTAGGT ATCCCAACAT 

TCGGGGCCCT GGCAGCTTGG TGTTATAACA 

SO 

TAGGTTTCTT CGCTGGTAAG CGTTTCGTAC 
TAGCATTCCC AATGGCATTA ATTrGGCCAA 

55 



TGAGTCTCCA ACTAACACTT CAGATACACC 7140 

AGGATGACTA TGTCTCGTTG CTTCAATTGT 7200 

ATCACTCCCT ACAATAAAAC CATATATTTG 7260 

ATTTTTCTTA TTGACCAAGT CAACAGATAA 7320 

ACAAAATGAA AGTAATGTAA AATCATTCAA 7380 

GGAAATAATA CTTGCATTCA AACAGCACTT 7440 

CtCAATTGAT GTACTATGAT CGATACGAAT 7500 

GTCATAAAAA GATGGTGTTA AAATAGATGG 7560 

ATGTTTTAAT AAATTGAGTA GTTTTGTGAA 7620 

TGGTATTTGT ACAGATGTAA AAATCATTTG 7680 

CGCTTCATCT AAAGGTTGTC CTAAATACAC 7740 

CAATATAATT ATTAGGAAAA TATAGTTGAT 7800 

GAAAACACAT TACAATATTA ATCAGTTAAA 7360 

CTGTCACAAG TTAATTATTA CACCATCAAA 7920 

GCTGCTACTG CTGGATTATT ACAATAACTT 7930 

TATGTTTTAA TAATAATCTG TGAACAATTA 8040 

TTGAAAACGC ATACTTCACC ATGCTAAAAT 8100 

ATGTGATGGT TACCAACACA GTCTATTTGC 8160 

TAAATACAAC TTTGGAGGTT GGACAAGTGA 8220 

TTGGTAAAGC GCTAATGTTA CCTGTTGCGA 8280 

TCGGTACAGC TATGCAAGGT GAATCATTAC 8340 

GCGTACAAAC TGTCGCTAAA TTAATGACAG 8400 

CTATGATTTT CGCATTAGGT GTCGCAATCG 8460 

TCGCAGCATT CGTCGGTTAC ATAATCATGA 8520 

CACCTAAGAA TATTGGTGAT CCAGCGAGTG 8580 

TACAAACAGG TGTGTTCGGC GGTATTATAA 8640 

AGTTCTATAA CATTAACTTA CCATCTTATT 8700 

CTATTATGAT GGCTACAACA TCATTTATTT 8760 

CGATTCAATC AGGATTAAAT GCATTCAGTA 8820 
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TATTAATTCC ATTCGGTCTA CATCACATTT TCCACGCACC GTTCTGGTTC GAGTTTGGTT 
CATGGAAAAA TGCAGCTGGT GAAATTATTC ACGGTGACCA ACGTATCTTT ATCGAACAAA 
TTCGTGAAGG CGCACATTTG ACAGCTGGTA AATTCATGCA AGGTGAATTC CCTGTTATGA 
TGTTCGGTTT ACCTGCAGCA GCTTTAGCAA TTTATCACAC AGCTAAACCT GAAAATAAGA 
AAGTAGTAGC AGGTTTAATG GGTTCTGCTG CTTTAACATC ATTCTTAACT GGTATTACAG 
.AACCATTAGA ATTCTCATTC TTATTTGTAG CACCATTATT ATTCTTTATT CACGCaGTAC 
TTGATGGTTT ATCATTCTTA ACATTGTACT TATTAGATCT TCATCTAGGT TATACATTCT 
CAGGTGGTTT CATCGACTAC TTCTTACTCG GTATACTACC TAATAAGACA CAATGGTGGT 
TAGTCATTCC TGTAGGTCTT GTATACGCAG TTATTTACTA CTTCGTATTC CGATTCTTAA 
TTGTAAAATT AAAATACAAA ACACCAGGTC GTGAAGATAA ACAATCACAA GCGGCTACTG 
CTTCAGCAAC TGAATTACCA TATGCAGTAT TAGAAGCTAT GGGTGGCAAA GCAAACATTA 
AACATTTAGA CGCTTGTATC ACACGTCTAC GTGTTGAAGT TAACGACAAA TCTAAAGTTG 
ATGTTCCTGG TTTGAAAGAT TTAGGCGCAT CTGGTGTATT AGAAGTCGGC AATAATATGC 
AAGCAATTTT TGGTCCTAAA TCTGACCAAA TCAAACATGA AATGCAACAG ATTATGAATG 
GTCAAGTAGT AGAAAATCCT ACTACTATGG AAGACGATAA AGACGAAACT GTTGTTGTTG 
CAGAAGATAA ATCTGCAACA AGCGAATTGA GCCATATCGT GCATGCACCA TTAACTGGTG 
AAGTAACACC ATTATCAGAA GTGCCTGATC AAGTGTTCAG CGAAAAAATG ATGGGTGACG 
GTATCGCTAT CAAACCTTCA ♦ CAAGGTGAAG TTCGTGCACC ATTCAACGGT AAAGTACAAA 
TGATTTTCCC AACAAAACAT GCAATTGGTC TTGTATCAGA TAGTGGTTTA GAACTATTAA 
TCCACATCGG TTTAGACACT GTTAAATTAA ACGGAGAAGG CTTTACTTTA CATGTTGAGG 
AAGGTCAAGA AGTTAAACAA GGTGATTTAT TAATCAACTT TGATTTAGAC TACATCCGCA 
ATCATGCAAA GAGTGATATT ACGCCTATTA TCGTGACACA AGGAAACATT ACAAACCTTG 
ATTTTAAACA AGGTGAACAT GGCAACATTT CATTTGGCGA XCAATTATTT GAAGCTAAAT 
AATGCTTACT ATAAACAGGT GCGTATACCT TCATAAGGTG ACGCGCCTGT TTTTTCTTTG 
CTATTGTATT TTGCAGCATC ATTGATAGTT CGCTCTCCCC TTAAATTTTG AATTTTAAGA 
TCATCAATTA AAGCCCCCCT TCATACTCAT TTCCTAAAAA ATATTAATTG TTCACTATTG 
TTAGCGTTTT CACAACAAAG TCAACTTCCT TGACCTTACA CTATATTCGA GGCTATCATT 
TTAAGTGTAA ATATAGAGAA AAGGTGGCTT TTTTTATGAA ACAACGCATT GGAGCTTACT 
TAATTGACGC TATTCATCGA GCAGGCGTCG ATAAAATTTT TGGTGTTCCT GGTGATTTTA 
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ATGAATTAAA CGCAAGTTAC GCAGCGGACG GTTATGCCCG TCTTAArCGA CTCGCTGCAT 10740 

TAGTTACTAC ATTTGGTGTT GGCGAATTAA GTGCCGTCAA CGGTATCGCA GGTTCATATG 10800 

CTGAACGCAT ACCTGTCATT GCGATTACAG GTGCGCCGAC ACGTGCTGTT GAACAAGGCG 10860 

GTAAATATGT ACATCACTCA CTTGGTGAAG GTACATTTGA CGACTATCGA AAAATGTTTG 10920 

CACATATAAC CGTTGCACAA GGTTATATCA CACCTGAAAA TGCAACAACC GAAATACCAC 10980 

GTTTAATTAA TACAGCAATC GCCGAAAGAC GCCCAGTTCA TTTACATTTA CCAATCGATG 11040 

TCGCAATCTC TGAAATTGAG ATACCGACAC CATTTGAAGT GACGGCAACT AAATATACGG 11100 

ATGCATCAAC ATATATAGAG TTATTAGCAA CTAAACTGCA TCAAGCGAAG CAGCCTATCA 111€0 

TCATTACTGG ACATGAAATT AACAGTTTTC ACCTCCATCA AGAATTAGAA GATrTTGTAA 11220 

ATCAAACACA GATACCAGTA GCACAACTTT CATTAGGAAA AGGTGCTTTT AATGAGGAAA 11280 

ATCCATATTA TATGGGTATT TACGATGGGA AAATTGCCGA AGATAAAATA CGAGATTATG 11340 

TGGACAACAG CGATTTAATT TTAAATATTQ GAGCCAAATT AACAGATTCA GCAACAGCAG 11400 

GTTTTTCATA CCAATTCAAT ATCGATGATG TCGTTATGTT AAATCATCAC AATATCAAAA 11460 

TTGACGATGT TACAAATGAT GAAATATCTC TACCATCATT GTTAAAACAG TTATCCAATA 11520 

TTTCATATAC GAATAACGCA ACGTTCCCTG CGTATCATCG TCCAACATCA CCCGATTATA IISBO 

CTGTTGGCAC AGAACCATTA ACACAACAAA CTTATTTTAA AATGATGCAA AATTTCTTAA 1X640 

AACCAAATGA TGTCATCATT GCTGATCAAG GTACATCATT CTTTGGTGCT TATGATTTAG 117 00 

CATTATACAA AAACAATACT TTTATAGGGC AACCGTTATG GGGTTCTATC GGCTATACAT 11760 

TACCTGCAAC ATTAGGTTCA CAATTAGCAG ACAAAGATCG TCGTAACTTA TTATTAATTG 11820 

GTGATGGCTC ATTGCAACTA ACTGTTCAAG CTATTTCAAC TATGATTAGA CAGCATATTA 11880 

AACCGGTATT ATTTGTGATT AATAATGACG GCTATACGGT AGAACGACTT ATTCACGGCA 11940 

TGTATGAACC TTATAATGAA ATTCACATGT GGGATTATAA AGCTTTACCA GCTGTATTTG 12000 

GTGGTAAAAA TGTTGAAATT CATGACGTTG AATCATCAAA AGATTTACAA GACACGTTTA 12060 

ATGCAATTAA TGGTCATCCC GATGTGATGC ATTTTGTCGA AGTCAAAATG GCTGTCGAAG 12120 

aCGCACCGAA GAAACTCATC GATAtCGCTA AAGCTTTTTC ACAACAAAAT AAATAATTTC 12180 

ATCGTATACA GGGTATAAGT TTAAGCGAAT ACTTTATTAA ACGAATAGGA CTCTGATATA 12240 

AGATGATTAA TTTTAATAAA ACCGCTTTAG TGTTAATCGA CCTGCAAGAA GGTATTCTTA 12300 

AAATGGATTA TGCCCCATAT ACAGCTGAAA ATGTCGTTCA AAACGCTAAT AAATTAATAG 12360 

ATGTTTTTAG AAAAAACAAT GGCTTTATCG CTTTTGTTCG CGTGAATTTC TATGATGGTA 12420 
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AGTCGTTTCC ATCATTTATT AGACAAGAGA GATGACGATT TTGTCATAGA CAAACGACAT 12540 

TTTAGTGCAT TTGTAGGAAC AGATTTGGAC TTACAATTGC GACGTCGAGG AATTGATACG 12600 

ATTGTTCTTG GTGGTGTCGC AACGCATATT GGCGTAGATA CGACAGCGCG AGATGCCTAT 12660 

CAATTAAACT ACAAXCAGTT TTTTGTTACA GATATGATGA GTGCACAAAA CGAAACGCTA 12720 

CATCAATTTC CAATAGATAA TGTATTCCCA TTGATGGGAC AAACAATAAC TACAAACGAC 12780 

TTTCTAAATA TATTGAACTA AACATATACT TCCCCCCTTC GATCATGTTG AGGGGGATCT 12840 

TTATTTCACA AAGTATTAAT ACGTCGQGTT GTCTAACCTT CTATATTTAA CATATTCTAT 12900 

ATCTGTTAAA TCGTTCTTAA CTTACGCCCC TACTACATAA AAAACAGTAT TTATTCCGGA 12960 

ATTTTCAAAA AATTTAGTAT TTATTGCAAA ATTATGTATC ACTTTATGTT TAATTTTTGA 13020 

TATTATCTTA ATTAAGTAGA TTTTTATAAG TTCTAAAAAG GAGAACAAAT ACATATATGA 13080 

AGAAGAAACT AACATTTAAA GAAAACATGT TTATAGGTTC TATGTTATTT GGTTTATTCT 13140 

TTGGTGCCGG CAATCTTATC TTCCCAATAC ACTTGGGTCA AGCTGCTGGT TCTAACGTTT 13200 

TTATCGCTAA CTTAGGATTT TTAATTACAG CAATTGGCTT ACCATTTCTA GGTATCATTG 13260 

CTATTGGCAT TTCAAAGACA TCTGGTTTAT TTGAAATTGC ATCGCGTGTT AATAAAACAT 13320 

ATGCTTACAT TTTCACGATT GCCTTATATC TAGTTATCGG ACCATTTTTC GCCTTACCTA 13380 

GACTGGCAAC GACATCATTT GAAATTGCAT TTTCGCCATT TTTATCACCA AAGCAAATCA . 13440 

CTTTATATTT ATTTATTTTT AGCTTCGTCT TCTTTGTGAT TGCATGGTTT TTTGCGAGAA 13 500 

AGCCATCAAG AATTTTAGAA TATATCGGTA AATTTTTAAA TCCGGTATTC TTAGTATTAT 13560 

TAGCAATTAT TTTATTATTT GCTTTTATCC ATCCATTAGG TGGCATATCT GATGCACCTA 13620 

TTAGTAAACA ATATCAATCA CATGCCTTAT TTAACGGCTT TTTAGATGGA TACAATACCT 13680 

TAGATGCGCT AGCGTCATTG GCATTTGGTA TTATCATTGT TGCAACGATT AAAAAGTTAG 13740 

GTATCGAAAA TCCAACTGAT ATCGCTAAAG AAACAATTAA GTCTGGTACT ATCAGTATCA 13800 

TTATGATGGG GATCATTTAT ACCCTACTAG CAATCATGGG TACATTAAGT ATTGGTCATT 13860 

TCAAACTTAG TGAAAATGGT GGTATTGCCT TAGCGCAAAT TACTCAATAC TACTTAGGTA 13920 

ACTACGGTAT CGTCCTGTTG TCACTTATCG TTATGGTTGC TTGTTTAAAA ACAGCCATCG 13980 

GTTTGATTAC GGCATTTTCA GAAACATTCG AACACCTTTT CCCTAAAATG AATTACCTAG 14040 

CGATTGCAAC AGTTGTAAGC TTTATTTCGT TCTTATTCGC GAATGTTGGT TTAACTAAGA 14100 

TTATTATGTA CTCAGTCCCA GTGTTAATGT TCTTATATCC ATTAGCAATT GCCTTGATTG 14160 

TACTAACATT ATTTAGTAGC AAATTCCATC ATTCAAAACT TATTTATCAA TGTACCATTT 14220 
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GCACATCATT CTCACAAACT TTGATTAATT TCAGCCAAAA ATATTTACCA TTATCAGACA 14340 

TTGGTATGGG CTGGGTTGTT CTCAGTTTGA TTGGTTTCAT TATCGGCTTC ATTATTTATA 14400 

AAATTAAGCA TCGTAAAATT CCACAAGCAT AATACTATGC CACAGTCATA TGTTAAACAT 14460 

ATGCTTGTGG CATTTTTTAT TCATACTACA TTAAACTGCA ATCGTATACA TACATATCAA 14520 

TGATTATCCA CAAAAAATAT TAGTACTTTC ATTTTACAAA TCACATTAAT ACAAACACAA 14580 

CCTTATCTTT ATATTATTAA ATTTATATTT GACACTTATA TTGAACAACT GTAATATATT 14640 

AATATTAATT CTTTAAAATG TATAAATATA AAGGAGGGAG ACCGATGaAT TCAATCATTG 14700 

aATTAACTGA TTATTATAGC TCTAATAATT ATGCACCACT TAAGCTTGTC ATTTCTAAAG 14760 
GTAAAGGTGT CAAAGTTTGG GATACTGATG GCAAACAATA TATAGATTGC ATTTCGGGTT . 14820 

TTTCAGTTGC AAACCAAGGC CATTGTCATC CAACAATTGT TAAAGCGATG ACAGAACAAG 14380 

CTTCAAAGTT GTCTATCATT TCACGTGTCC TTTATAGTGA CAATCTCGGG AAATGGGAAG 14940 

AAAAAATTTG TCATCTTGCT AAGAAAGACA AAGTACTCCC CCTTAACTCT GGTACTGAAG 15000 

CTGTTGAAGC AGCCATTAAA ATTGCTAGAA AATGGGGCTC TGAAGTTAAA GGCATTACTG 15060 

ACGGACAAGT TGAAATCATC GCTATGAATA ACAATTTTCA CGGTCGTACA CTTGGCTCAT 15120 

TATCACTATC TAACCACGAC GCATATAAAG CAGGATTTCA CCCCCTACTT CAAGGCACTA 15180 

CAACAGTAGA TTTTGGAGAC ATTGAACAAT TAACACAAGC TATTTCACCG AATACAGCAG 15240 

CAATTATTTT GGAACCAATT CAAGGTGAAG GTGGCGTTAA TATACCACCG AAAGGATATA 15300 

TTCAAGCTGT GCGTCAACTA TGTGATAAAC ATCAAATATT ATTGATTGCA GATGAAATTC 15360 

AAGTTGGTCT TGGTAGAACT GGGAAATGGT TTGCTATGGa ATGGGAGCAA GTCGTTCCAG 15420 

ACATTTATAT TTTAGGTAAG GCATTGGGTG GCGGCTTATA CCCTGTATCT GCTGTACTTG 15480 

CAAMAATGA TGTCATGCGT GTTCTAACAC CAGGTACACA TGGTTCAACA TTTGGTGGTA 15540 

ACCCTTTAGC CATTGCAATA TCGACGGCAG CGCTTGATGT ACTTAAAGAT GAACAACTGG 15600 

TTGAACGATC AGAACGCTTA GGTTCATTTT TATTAAAAGC GTTGCTACAA CTTAAACATC 15660 

CTAGTATTAA AGAAATTAGA GGTCGTGGTT TATTTATAGG CATAGAGCTT AACACAGATG 15720 

CTGCACCTTT TGTGGATCAA CTGATTCAAC GTGGAATCTT ATGCAAAGAC ACGCATCGTA 15780 

CTATCATTCG ATTGTCTCCA CCTCTAGTCA TTGATAAAGA GGAAATCCAT CAAATTGTTG 15840 

CAGCTTTTCA AGACGTTTTT AAAAATTAAC AATTAATCAT TTATATATGA CATAGGAGGG 15900 

ATTCATGATG ATTAAAGTAG GTATCGTTGG CGGTAgcGGT TATGGCGCAA TTGAATTAAT 15960 

TCGATTGTTA CAAACACATC CTCATGTAAC GATTGCACAC ATCTACTCAC ATTCAAAAGT 16020 
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ACTTACAGTG GaTAATAATG ACTGTGATGT AATTTTCTTT GCGACACCAG CACCCGTAAG 16140 

TAAAACATGT ATCCCTCCCT TAGTAGAAAA AGGTATTCAT GTTATCGATT TATCTGGCGC 16200 

ATTTAGAATT AAGAATCGTG AAATATATGA AGCATATTAC AAAGAAACTG CTGCAGCACA 16250 

AGATGATTTG AATCATGCTA TTTACAGCAT TTCAGAATGG CAATCGTTTG ATAACAATGG 16320 

AACGAAGCTC ATTTCTAATC CTGGCTGTTT CCCTACAGCA ACATTATTAG CATTACATCC 16330 

ACTTATTAGC GAAAAAATAG TAGATTTGTC ATCTATTATT ATTGATGCTA AGACCGGCGT 16440 

GTCAGGTGCT GGTCGTTCAT TATCACAACG gTTcATTTTT CAGAAATGAA TGAAAATCTA 16500 

AGCGCTTATG CAATCGGAAA CCATAAACAC AAACCGGAAA TCGAGCAATA TTTATCTATC 165S0 

ATTGCGGGTC AAGATGTATC AGTCATATTT ACACCACATC TCGTACCAAT GACACGAGGT 16620 

ATTTTATCAA CAATATATGT CAAATTATCA TCTGAATATA CGACTGAATC ATTACATAAA 16680 

TTAATGACCT CTTATTATGC TAATCAGCCA TTTGTCAGAA TTAGAGATAT TGGGACTTTT 16740 

CCAACCACAA AAGAAGTACT CGGTAGTAAC .TACTGCGATA TCGGCATCTA TGTAGATGAA 16800 

ACAACGCAAA CAGCAATTTT AGTATCAGTG ATTGATAACC TTGTCAAAGG CGCAAGTGGG 16860 

CAAGCCATTC AAAATTTAAA TATATTATAT GATTT7GAAG TGACQACTGG CCTAAATCAA 16920 

TCACCAGTTT ATCCATAAGG GGTGTTAGAA TGAAACATCA AGAAACGACA TCACAACAAT 16980 

ATAACTTTTC AATTATTAAA CATGGCGATA TCAGTACACC TCAAGGCTTC ACGGCTGGTG 17040 

GTATGCACAT CGGTTTACGC GCTAACAAAA AAGACTTTGG GTGGATTTAC TCATCGTCTT 17100 

TGGCAAGTGC AGCTGCCGTA TATACTTTAA ATCAGTTTAA AGCTGCACCA CTTATTGTCA 17160 

CTGAAGACAC TTTACAAAAG TCTAAAGGAA AATTACAAGC ACTTGTTGTT AATTCAGCTA 17220 

ATGCAAATTC TTGTACCX3GT CAACAAGGCA TAGATGATGC ACGACAAACA CAAACATGGG 17280 

TTGCTCAACA ACTTCAAATA CCATCTGAGC ATGTTGCTGT TGCTTCAACT GGGGTCATTG 17340 

* 

GTGAATATTT GCCTATGGAT AAAATTAAGA CTGGGACCGA ACATA7TAAG GATGCTAATT 17400 

TTGCAACGCC AGGTGCGTTT AACGAGGCAA TTTTAACAAC TGATACCTGT ACAAAACATA 17460 

TCGCTGTATC ACTAAAAATC GATGGTAAAA CCGTTACAAT TGGTGGTAGC ACCAAAGGTT 17520 

CAGGTATGAT TCACCCAAAT ATGGCTACCA TGCTTGCTTT TATAACAACC GATGCATCGA 17580 

TTGAATCGAA TACACTTCAT CAATTATTAA AATCTTCGAC TGACCATACA TTTAATATGA 17640 

TTACTGTTGA TGGCGATACA AGTACAAATG ACATGGTATT AGTCATGGCA AATCACCAAG 17700 

TTGAACACCA AATACTTAGT CAAGACCATC CACAATGGGA AACATTTGTT GATGCATTCA 17760 

ATTTTGTCTG TACATTTTTA GCTAAAGCTA TAGCCAGAGA TGGCGAAGGC GCAACAAAGT 17820 
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CTATCGTAAG 


TTCAAATCTA 


GTAAAATCAG 


CTATTTTTGG 


CGAAGATGCC 


AATTTTGGTC 


17940 




GAATCATTAC 


AGCTATTGGC 


TACAGCGGAT 


GTGAAATTGA 


TCCTAACTGC 


ACATATGTTC 


18000 


5 


AACTGAACCA AATACCTGTC 


GTTGATAAAG 


GTATGGCTGT 


ACTATTTGAT 


GAGCAAGCTA 


18060 




TGTCGAATAC 


ATTAACTCAT 


GAAAATGTCA 


CAATTGACGT 


TCAGCTTGGT 


TTAGGTAACG 


18120 


10 


CTGCAGCGAC 


TGCATACGGT 


TGTGATTTAT 


CCTATGATTA 


TGTGCGTATC 


AACGCATCAT 


18180 


ATCGAACATA AGGTGGTGTT 


GGTTAGATGA 


AA'nTATTGT 


CATTAAAATT 


GGTGGCAGTA 


18240 




CACTTAGTGA 


CATGCATCCA 


TCAATTATTA ACAACATTAA 


GCArn'ACGA 


TCAAACAACA 


18300 


15 


TCTACCCCAT 


TATCGTTCAT 


GGCGGTGGCC 


CATTTATTAA 


TGAAGCATTA 


TCAAACCAGC 


18360 


AAATCGAGCC ACACTTTGTT 


AATGGCCTAA GAGTGACTGA TAAAGCAACC 


ATGACCATTA 


18420 




CTAAACACAC 


GCTCATTGCA 


GACGTTAACA 


CTGCATTAGT 


AGCTCAATTT 


AACCAGCACC 


18480 


20 


AATGTTCTGC 


AATAGGCTTA 


TGTGGTTTGG 


ATGCACAGCT 


GTTTGAAATT 


ACATCTTTTG 


13540 




ATCAACAATA 


TGGATATGTC 


GGTGTTCCGA 


CCGCTTTAAA TAAGGATGCT 


TTACAGTATT 


18600 




TATGTACTAA ATTTGTACCT 


ATCATCAATT 


CGATTGGTTT 


CAATAACCAT 


GATGGAGAAT 


13660 


25 


TTTACAATAT 


TAATGCTGAC 


ACGCTTGCCT 


A'lTlTATTGC 


ATCATCATTA 


AAAGCGCCTA 


13720 




TTTATGTATT 


AAGTAATATT 


QCAGGTGTAC 


TCATCAATGA 


TGTTGTTATA 


CCTCAATTGC 


18780 




CATTAGTCGA 


TATTCATCAA 


TATATTGAAC 


ATGGTGATAT 


TTATGGAGGT 


ATGATTCCCA 


18840 


30 


AAGTGCTAGA 


TGCCAAAAAT 


GCGATTGAAA 


ATGGCTGTCC 


TAAAGTTATC 


ATTGCATCAG 


13900 




GAAACAAGCC AAATATCATT 


GAATCTATTT ACAATAATGA TTTTGTTGGC 


ACAACAATCC 


13960 


35 


TTAATTCATA 


ACTATGAAAT 


TAAGGCCTAA 


CAAGTTTTGA 


CACGCGAGAT 


GATTCCAGTT 


19020 


CGATTATCCA 


TTGCGCTAAA 


ACATTTArrr 


ACCGTTCATC 


TCGTTAACAA 


TTTTGAATAC 


19080 




AGT^CGATAC AATATGAGAT 


GTAAAAAACT 


AATAACCTTT 


TACAAATTTG 


TTTATCAAAA 


19140 


40 


TA'rriU'AAGT 


TTTGCAAAGC 


TTrTTATTGT 


GATTATTTTC 


ACAAAATACT 


AXAA7GAGGA 


19200 


TAGTAAATAG 


AGAGGAGTCC 


TTAAGTTGAC 


GAAACGACAA ATGGGTATAT 


TCATTiATGC 


19260 




TGGAATTATC 


GGTGGCTTGT 


TATCTGGAAT 


TGTAAAATTA 


GGTTGGGAGG 


XCATGTTTCC 


19320 


45 


ACCTCGCACA 


CCAGAACGTA 


A7GCAACGAA 


CCCACCTCAA 


GAGTTATTGC 


AACAATTAGG 


19380 




ATTTAGTAGT 


GAGTTTACGC 


ATCAAACATA 


TACATTTTCA AATATGGAAT 


TGCCTTGGGT 


19440 




AAGCTTTATT 


GTCCACTTTA 


GTTTTrCTAT 


CGTCATTGCA 


ATTATTTACT 


GCATATTAGT 


19500 


50 


TAAAAAATAC 


GCTTACTTAG 


CAATGGGACA 


AGGTGCTGTT 


TTTGGTATTG 


CTATTTGGGT 

* 


19560 




ATTATTCCAC 


CTTATCATTA 


TGCCAATCAT 


GCATACTGTA 


CCTGCTGTGT 


GGGATCAACC. 


19620 
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AGTGCGACAA CATTTTGTCT ATCGCTATAA ATTAAATTAA TACACTGACT AACATTAACXj 19740 

TGAGTTTtAA ATCATCGTTT GAGTATGATG ATTGATGCTC ACGTTATTTT ATTAACTGAC 19800 

ATGATATGAT TCCAGCCAAC TTACGTGAGC ATTAAAGTCT CAAATGCGTC GTAACAAACT 19860 

ATTATTTTCG GTAATTTCAA TATTGCTCAG TATATTTTTA CCTTATCACT TACTTTAATC 19920 

TCGTCATGAT TTTGAATGAT GCCATCGTGT ATTCACCTTT CATTTTTCCA ATAAAAAAAC 19980 

ATCTAACAGT AAACATTTAG GCAGTATAGT TTAAAATCAC TGCGCAATGA TACTGTCAGA 20040 

CGTCATATTA ACTACTCAAT AACTGAAATA CAGACACTTT TTTATAACCC CAGGGTGCCT 20100 

GTCCTAAGAA ACATACCTGT ACCATAAACT GATCAAAAAT AAATTGTTTG AACTTCACTT 20160 

CACGTGATTG ATAAAAGTGT GATTGTGTCA TATCATAAAT GTCCAATCCT TTGATTAAAC 20220 

CTTCACCAAT CAATTTTGTA AAACTTTCTT TTTGTGTCCA TATTTGATAA AAATCATTTA 20280 

AACTACATAT TTGATGTGCT TCGTTTGTAG AGAAACACGT CACTAACGTA CGCCAGTCTA 20340 

AACGTTGTGA TATCTTTTCG ATATCAATAC CAACTGGTTC TTTATCGACA ACACACACGA 20400 

TATAAGGATA ACTATATGAT AAGCTCACAT AGATGGGCTG TCCATCACGA TTGTGTTGAA 20460 

CAATATCTGC CTTACCTCGT GGCGAAATGT GATAATGCCA TTCATGTGGT AATAAACCTG 20520 

TGTCATGTTG AATTCCATAT TGCACTAAAA TATCTCCCAA TCTGTGCATG AGTTTATCTT 20530 

6ATTGTATCT ATAGTTGACT GTACGCGGTT TTTTATATGA CCAACGACTT TGTGATATTA 20640 

ATTCTTCAAT ACTTTTCAAG TTACTCTGTA ATTGCATTAC AAATACTGTC ATAACTTTCC 20700 

CTACTTACTT ATTGAATATT GTTTTGATAT ATTGTGCCCA ATGATACAGC CAATTGTTAG 20760 

TTATCGTTGG CCATTTTTCA CTGATGTGAT TCATTATTTT TAATGTTAAT GTTGTATCTA 20820 

TCATTGCTAG TTGTTGTTCA CGGTCAACAC TAGTTAATCC AATCGTTTCG TACATGTCTT 20380 

GTTTCTGTAA AATTTCATTA AATGATTCAT CGCTGACGAG TTCAATTTCT TTGCGCTTAA 20940 

CGCATTCTAA CAAAGATTTC ACCGGCATTT TATTAGGTGA TAGCACATGG TAAATGAXTT 21000 

GTGGTGTGTT GACCTGTGCT AATGCGACAA TTTGTCTTGC AGTCGTATCC ACAAAAGAAA 21060 

AATCTACAGG CATTTCAGCC ATGCTAACCC CGATACAATC CAGTTGTAAC AAATCATTCA 21120 

TTACCATTGA AAAACGGTTA GTCTTTATAT TTCTCATATG CCATCTTCCA TTGTAAGGAT 21180 

TCGTCAAATT ACCAACACGT ACAATCCGAC CATCTAAGCC ATTATTTACA GCTTCTAATA 21240 

CTTTTAATTC ACTATAAAAT TTGCTCCGTG TATATGGTGA TGTTAGTAGT TGCCCTTTAT 21300 
AGACATCCGC TTsTGAAAAT GTCACATCTT CTGTGTCTAT ATCAAAATAA GTTCCCACAC • 21360 

TTATCGTAGA CACATATATT AACCTTGCAT GATGTTGTTG TGCCAAACGT ATGACATCAA 21420 
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CACCTGCATG AATAATCGTA TCCATGTTTT CTGGTAAAAC AACATCATCC ATACACTCGA 
AATCACCAAC AATGACTTCA ATGTTTGATA ACATTATTTC AACCGTCTCT TCTGAAAAAT 
AATCATTTAA ATTCGTCATC AACTTATACC ATGCTATTTC CTCATTATCA GCACGTATGA 
AACAATAAAT GCGATGACTG TATCCTTGTA GTACTTCAAT CAGATAAGCA CCTAAAAAAC 
CTGTCGCGCC AGTCAATAGT GTATTTCCTA GAGGTCGATG ACTTAGACTA TCCTCTAAAA 
TACCCAAGTT ATAACGAGAC ATAACAATCT TTTGTAATTC CGAAAGATTA TCCGGTAATG 
CAACTAATGA TTGTTGATTT TGGTACATAT AATTAACAAT CTGTCGCACG GTTTTATATT 
GGTATAATGT CTGCATTGAA ATATGATGGC CAAATCGTTT TAAATGCGAG ACAACTAACA 
TCGCCTCTAA TGAGTTACCA CCAAGTTCAA AGAAATCATC GTCAACACCG ACATCATTTT 
GTTTCAATAC CTCTCCAAAT ACATGAACAA ATGTCTGCTC AATTTCATTA GAGGGTTCGC 
TATACACTTT ATTAGACTGT TGTATAGGTG ATGGATTTGG CAAACGCGTA GTATCCACCT 
TGTCATTCGT GGTTAATGGC ATACAATCGA TATGCGTTAT AGTCTTAGGA ATCATATACT 
TAGGCAGCTG ATCATTTAAA TATTGCTTCA AATCCTGTTC CACTTGTTGC TCTCCGACAT 
AATAAGCATT CAATATATCA TGCGTATCAA AGTGACTTAC TGTTACAACA CAATCAGATA 
TACCACGAAT AGCTAATATT GCATTTTCAA TTTCATCAAG TTCAATACGG TACCCGTTAA 
CTTTCACTTG TTTATCTATT CTTCCTAAAA ATTCAATTTG ACCATCAGAT GTATAACGTG 
CTAAATCACC ACTATGATAC AACTTTCCTT TACCAAATGG ATTATTTTGC CATTTATCAG 
CCATTAATTC TGGACGATTA ATATATCCTA TCGCTAAACT ATCACCTGCA ATACACAACT 
CGCCTGGCAT ACCAATACCG CATAACAAAC CATCTGACAT AATATACACT TGGATGTTAG 
ATAAGGGTTT GCCAATTGGA ATCGTCTCAG GTATCAAATC ACCACAATGA TGTGACCAAT 
ACGAf GTGAT GACTGTTGAC TCAGATGGTC CATAGGCATT GAAATACGTG CCACAATGCT 
TCTCAATATA TTTAACAAAG GATGCCGTAC TAGTTGCCCC GCCTGTAATC AACTTTTCAA 
TATAAAAGTC TTCCATAACA CTACACATCT GTAACGGAAT CGACGCAACC GTCACACGAT 
GCTTATTAAT GAGTTGTTGT AACTGTTCTG GATTAACACG TTCCTCTCTA TCTGGAATCA 
CAAGCGTATG ACCATTTAAC AAACAACAAT AAATCTCCAT AACTGATGCA TCAAAAACAA 
TATTTGCATG TTGCAAAAAT ACTTCATTGT CGCCTAATTG CAATTCAGTT GACCATGCAT 
GCACTAAATT CAACAAATTT CGTTGTCGTA TGGCAACCCC TTTAGGCATC CCGGTCGTAC 
CAGATGTGTA AATAGCATAC ATCTCATTAT CTAACATCGC TGTGTTTTCA AGTTGATTGC 
CATGTAAATC ATCATATTGT TCATTTTCCT TTOATTCAAC AAAGCCTTTA GCATTTTCCA 



21540 
21600 
21560 
21720 
217B0 
21840 
21900 
21950 
22020 
220B0 
22140 
22200 
22260 
22320 
22380 
22440 
22500 
22560 
22620 
226B0 
22740 
22800 
22860 
22920 
22980 
23040 
23100 
23160 
23220 
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TAGCATCCTC CAAAATTGCA CCTTGTCGTT TATTCGGAAA ATCAATATCG ATAGGTATAT 23340 

AAGATGCACC TACTTTAACT GTCGCCAACA TCGCCGCAAr CATTTCAAAA CTACGTTCTG 23400' 

5 TAAACAAGGC AACCCGTTGA CCATTGCCCA CACCATTTGA TAGGAGCATG TGCGCAATGG 23460 

CATCCACATA GXTGCGTAAT GTTTCATACG TCATTGTCAA ATCATTCATG ACTAGCGCAA 23520 

CATGATTACC TTGTCGTGAG ACAACTTCAT TAAAGTAACT TATGATAGAT TTATTTCCCG 23580 

GGACATTAAG CATTCGATCG TTAACATGCG TATTGACCCA ATTTAGAAGT TCCTCCGTGC 23540 

CGTTTGGTAT ATCACAAATT TGTAGTGTAT CTTGATGCTT- CAAAATATAA TCAATCATAA 23700 

TCATACATTG ATTACCCATG TGACGAACTG TTTCTGAGTG ATATAAATCG GTATTATACT 23760 

75 . 

CGATATTGAT TGTATAGTCA TCGCGATCTT CTTCAATGAT GAAAGATAAA TCAAATTTCG 23820 

CCGTCACTGA TTTGGGTTGA ATGTGTGTTA ATTTACTATG CCCAAAATGA GCATGATTCG 23880 

TTTCATTGTT TTGTAGTACT AACATGACAT CAAATAATGG ATTCCGTGAG GCATCATGTG 23940 

20 

ATTOATCTAA GTCATTTACT AAACATTCQA ATGGGTATTC TTGATGCTCG TATGCCTCCA 24000 

AACTCATTTC CTTAACCTCT TGTAAAAACT GTGTCCACAT TTTATCAGGT GACGGTTGCC 24060 

2s CTCTATATAC CAACGTATTA GCAAACATGC CTAGCATTTG CTCCGTGCCT TTATGCATAC 24120 

GCXjCACTCAT CACACTACCG ACAACAACAT CATCTTTTCG AGCATATCTA CTTAACAACG 24130 

TCATGACCAC ACTCATAAAG AACATAAAAT CAGTAATTTG ATGCTTTTCT ACATACTTTT 24240 

30 GAAGTAGCTG TCTCATTTGT TGATTCATTG TAAATGACAT CATTGCTCCA TTTGTCGTTT 24300 

TAATATTTGG TCTAACATAG TCTGTCGGTA AGCTTAAAAT AGGTACTTCA TCTTTGAATT. 24360 

GAGATAACCA ATATTGTCTA TGTTTCGTCA TATCACGATG CGACATCCAC TCACTATAGT 24420 

CTTTATATTG CAATTTAAGT GGTAACAATA ATTTATGTTG ATAAAGTGCG TTAAGATCAT 24480 

TCATTAATTG TATATTACTC ATACCGTCAT TAATGATATG ATGCGTATCT ATAAAGAGGT 24540 

ATGCATGTAA GGGACTTCTA ATGTATCTCA CTCTAATTTG ACTTGGCTTT TCCAAATTAA 24600 

40 

AAGGTGCTAC AAATTGGCGC ATGATTTCTT GTTCATCCGT AAAATGCGTG TTAACTTCTT 24660 

CAAAGTCAAC TGCAACATCT GCCACAATAC GTTGTCGAAC CTCATCATCT ACAACAATAT 24720 

ATTGTGTTCG TAAAATCTCA TGTCGCGCTA TCAAACGCTG CACTGCTTGT CGCAATTGAG 24730 

45 

CTACATTAAG TTCTGATGAT AACCGCCATA AAAAAGGTAC GTTATACACC GTATCTTTAT 24840 

GGTTTGATTT CCATAATAAA TACATACGCT TTTGTGCAGA GCTCAGCACA TAATCATCTT 24900 

so TAACTATAGT TTCTGGAATC ACTTCATAGT TTTGTTCTTG AACCTTAGCA ATCGCTTGTG 24960 

CTAGTTCAAA TACAGTTGGC TTTTGTAATA AATCACCAAT TTGTAATCGT TTCCCAGTAG 25020 
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AATTATCATG 


AATACCTACT 


TGATTCACAT 


GTAAAATATC 


TGCAAAAATT 


TGGCATAGCA 


25140 




AGTGTTCGGT 


ATCTGTACTC 


GGTGCTACAT 


AGGCATCCGT 


ATCGACATAG 


TCCATGATAG 


25200 


5 


GCAATGCCTT 


CTTATCTAAT 


TTCCCATTAA 


TAGTAATAGG 


AATTTGCTCA 


ATATGCATGA 


25260 




AATTAACTGG 


TATCATGTAC 


TCCGGTAAGG 


TCATACGTAA 


TTGTGATTTA 


ATCTTATTAT 


25320 


10 


GTGATAATGT 


ATGCATCGCT 


TCATAATAAG 


CAACGATATA 


CTGATCTTGA 


TCATGATTTT 


25380 


GAACAATAAC AACTGCTTTA TTAATACCTT GTATACGCTC 


GAGCGCATGC 


TCAACCTCTG . 


. 25440 




ACAACTCAAT 


CCTAAACCCT 


CGAATCTTAA 


CTTGTTTGTC 


CTTTCGATAT 


AAATAATCTA 


25500 


15 


TGTTGCCATC 


GGGTAACAAA 


CGAACGATAT 


CACCACTTCT 


ATACATCAGC 


TGaTTTATAT 


25560 


TTGAATCTTT 

* 


GATAAATTTA 


TCTGCTGTCA ATTCTQGCTG 


ATTTAAATAA 


CCTGCAGCTA 


25620 




ACCCAAAGCC 


ACTTGTACAT 


AATTCTCCAG 


GAATACCAAC 


GCCACACCGA 


CGCTCGCCTT 


25680 


20 


GCATGATATA 


AACATGAGTA 


CCCAGAATCG 


GTTTACCAAT 


AGGAATACGA 


TTTGGAACTT 


2S740 




TGTTAGGTAT 


ATTATACGTC 


GTTGTAAATG 


TTGTATTTTC 


AGTTGGTCCA 


TAACCATTAA 


25800 




TAATTTGAGG ATGCTTCGGT 


TTTTGATTAA 


GCAAATCCAC 


CCACTTAGCA 


TTCAATACTT 


25860 


25 


CTCCACCAAT 


TAATAAATAC 


TTTAACGGTA 


CCAATACTTC 


TATTCGTTCA 


CTAGCAATCT 


25920 




GATTAAATAA 


TGAGGAGGTT 


AACCACATAG 


TATTAACGTC 


ATTTTCATTG 


ATTAATTGTT 


25930 




CTACCGCTAT 


TGGATTTAAT 


AATTGTTCTT 


TTTTAGCAAC 


AATCAGCTTT 


CCACCATTGA 


26040 - 


30 


GCAATGCACC 


ATATATTTCA 


AATGTTGCAG 


CATCAAAGGC 


TATAGTTCCT 


GATAACAAAA 


26100 




TCGTCGTCTC 


TTCATTTAAT 


GGTACATAAT 


GATTTTGATG 


GACCAAGCXiSA 


ACAATACCTC 


26160 




GGTGCGGAAT 


TAGTGTCCCT 


TTAGGGTTAC 


CAGTTGTCCC 


CGACGTGTAA 


ATAACATAAG 


26220 


35 


CATGATCTTC 


TAACGTGTTA 


CATTTAGAAA 


GATTATCAAT 

• 


ATTTTTCCAC 


GCTATCTTAT 


26280 




TCAAfiTCAAT GTGATTAATA TTTTGTTTAC CATTTTCATA 


TAAAGCTTGG 


TACGTTATTA 


26340 


40 


CAACriTAGG 


CGTTACATCT 


TTTAAAATGT 


ACTCCTGACG 


ATCACTTGGA 


TAGTTCGGAT 


26400 


CAATTGGCAC 


GTAAGCCCCA 


CCAGCTTTCA 


ACACACCTAT 


CATCGCTATT 


ATCATCTCAA 


26460 




TACTTTTTTC 


AGCTATGACA 


GCGACACGAT 


GATTAGGTTC 


AACACCATAC 


TGGTTTCTCA 


26520 


45 


AACGGTGTGC 


TAAATCATTC 


GCGCGTGCAT 


TCAATGTTTG 


ATATGTTATA 


AACAcTCCGT 


26580 




CAAATTGCAC 


AGCGACATGA 


TTCGGCGTTG 


CTTCAACTTG 


TTGCTCAAAT 


AAGGTAACAA 


26640 




CTGTTTGCGC 


ATCATCTATC 


TCAGGCAAAC 


TTAAATTGAT 


ATCGTCATAT 


AATTGAATAT 


26700 


SO 


CACGTTCTGT 


CATCAAATTA 


. AGTTCATCTA 


CAGTTGTTCG 


TTTATTTCCA 


TTTTCTTCAG 


26760 




TAATTTGCAA ATAAATATTT 


CGAACTAAGT 


CACTCAGCGT 


CTCGATTGAG 


AGCAAATCAT 


26820 
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- CTAAAGATGT ATGTGCATCA 


TGTATTTGAT 


GTACATCCTC 


AATAACATCA 


TTACAACAAG 


26940 




ACATCATATG 


ATGATAACAA 


TGAAAAATAG 


TCTCTAGTGA 


AAGCO^GAC 


TTCGCGCACt 


27000 


5 


GTAATTGCGA 


CATATTTTGC 


AACACACATT 


TATTAAAATC 


TGTTGTAAAA 


CGTTGACATA 


270SO 




CATCTTTTGC 


ATCGATTGTT 


AACGTTAACG 


GCACAATATT 


TCCGTGTAAA 


TCATTTGGTA 

• ■ ■ 


27120 


1 V 


AATGTGATGG 


TACATGTATA 


CCTAATGTGA 


CATCATGTTG 


TTGACTCATT 


ATATGATTAG 


27180 


CTAAATACAC 


ACTAACAGCC 


AACGATGCCA TATCTATTGA TGTCATATCA TCAATCAAAT 


27240 




ACGTTTGATA 


TAAAGCTTGT 


TCAAATGGAT 


GCTTAATTGG 


AAAATAACTA 


TCAATATGGA 


27300 


15 


TGTCAGAGTT 


ATTCTCTAAC 


CGAAAATAGT 


TTGAGTCTAA 


TGCTATATGC 


GATGCATCTT 


27360 




GATTGTCTTT 


ATCATCATTT 


CTATTTATAT 


GTGCATGCTG 


TCGAGTATTG 


TTAATAACAG 


27420 




TATTGCCACG 


ATATGCATTG 


CATAAATCAT 


CAAGAAHAAT ATCAATTTGA CTATCATCga 


27480 


20 


AAATGGaCAC 

* 


ATGAAAATCT 


aATAGTATAT 


ATGcAGCATC 


AGCGAACTGin 


AACAATTTAA 


27S40 




CTTTGAATAA AGGTGAATCA 


TTAAAATGGT 


AAGTACTTAA 


TTCTTGCTTA 


AAAAAAGCTT 


27600 




CTAAATCATA 


GTTTGCGGAA 


GAAGATGGAA 


CTTGTTTTAT 


CTCAATAAAA 


GGCAGAAATT 


27660 


25 


CATGAAGTAT 


CATTGTTAAA 


TTGTCATCGG 


TAGTAACATC 


AAAAAAATGT 


CTTATAGATG 


27720 




CATGTTGTgC ACAATTGTCG 


ATAATGCATA 


CATCATTTTA 


GTAGCTTCAA 


CATTTTTAGC 


27730 


30 


GAGTTTAACC 


CAATACGCAT 


TACGGTGTGT 


CGTTGATTCT 


GTATTA'rrrr 


TGTATATACG 


27840 


AAAATATTCC 


TGTTGAAATC 


TCAAATTACC 


CATAATCATA 


AAAAGTCCTT 


CTTTCATATC 


27900 




ATAATACTCA 


TTACTTACTG 


AAATTGCATG 


ATGATATGAT 


AACCGACGAA 


ATGTTAATTA 


27960 


Off 


ACTCGTTATG 


TAATGaTTAA 


TATaAAACAC 


CATTCGCAAC 


ATATGAGCGA 


TATATTCTAC 


23020 


CCTAAAATAC 


ATCTTGTATC 


ATCGTTACAA 


TTGGTATATT 


TTTCAATGTA 


AATTACATAC 


28080 




ATCTTCGATA 

* 


AATAGCACAC 


TACAAATCGT 


TAATCACTTT 


CTGTTGTTCA 


CATCTCATTG 


28140 


40 


CAAACTCAAT 


ATTGTTGTTA 


CAAAATATCC 


ATGAAGCAAG 


TTTATATTAA 


ACAAACAACT . 


28200 




CGCATAAAAC 


AATTGTTATC 


CTTAAATTTT 


AACAAATTCT 


TAATAAATrr 


ATCTCTATTT 


28260 




TAATTACGAC 


CAAATTAATA 


GGTTTTCCAT 


ATAAAAAGAT 


GCATAAAATA AATATTTAAA 


28320 


45 


TAAATTCAAT 


TTGTATTCAC 


TTGTTTTTGT 


CCCCCAAATA 


CACCAGCAAC 


AAGCATGCTA . 


28330 




GCACCAATTG 


TTAAAACGAT 


AAACATATAC 


AGTCCCATTT 


GTAATGACGT 


TAAGAAAACA 


28440 




CCCAACACAA 


TCCCTAACCT 


AGCTAGTGTT 


TCTGAAAAAT 


GAATACCTAA 


TGCATTAACT 


28500 


SO 


GCACTATATG 


TTCCTCTTTT 


AGCTTTAGGA 


ATAATTTTAA 


AGCGTTGTTC 


TGAAACTATA 


28560 




GGCGAATAAA 


TAATTTCACC 


TACAGTCGCA 


ATTATCATAA 


AAACAACTAA 


TAAGCCAAAC 


28620 
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IS 



20 



25 



30 



GCTTTTTTAA AATCTATTTT CAATACAACT TTCGAGATTG AATACGTGAG TAaAATGACG 28740 

ACGACCGTAT TAATCATTAG CAAGATTGCT AACATCTTAG CACCTGTAAT ATCATATGAA 28800 

CCTATACTTA TTGTTTCAAA CTGATCCTTT AGTCTAATAG CAATATATGA GGAGATTGAA 28360 

AATTCACCCA TCATGATGAT ACTGAACCCC GAAATCAATA ACATATAATT ACGGTCTTTC 28920 

AAAACTAATT TATAACTGCG AAATATATTC ATTATTTGTA ATTTTTGATA ACGACTTGCA 28980 

TGCCTCTTGT CATCACTTTG CTTTACTTGA TTTCGGTCTT GAGGTAACCA AATATATAAA 29040 

ATAAAGAGTA CAATTAAAAA TATACAAGCT GCTATTAAGA AAAGTAGTAA CATACTGTAG 29100 

CCATACATCA AGCCACCTAA CAATGCCCCA ATAGCTACCG ATAAGTTTGT CATCCAATAG 29160 

CTAATCTTGT AAATATAATG TTCCACGTCT TCGGTAATTG CATCCATAAT TAATGTGTCC 29220 

ATAACTGGAA ATTGTAATCC CCAAACGATT GTAAATATGG CATATGCAAC ACAAAAACCA 29280 

ATAATTTGCC ACAATTGATG TGACCCAAAT ACGCCCATGA ACACAAGCAT TATCACCATC 29340 

GTCGCTTGAT AAATAAGTAC TAGCAACTTT tTCGGAAATA TCTCAATAAG GTAACCAGAT 29400 

ATAATGGACA ATGGAAATTT nAGAACCACT AAACCAACAA GATATATACC GACAATTGAT 29460 

TGACTTAACA TATCTGTTAA ATATAGTGCT ATAAACGGTA TAAATGCTGT CGTAATAATT 29520 

AGCTGTAAAA nATTGCTAAT CAATCGTACT TTCAA 29555 
(2) INFORMATION FOR SSQ ID NO: 207; 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 153 9 base pairs 

(B) TYPE; nucleic acid 

(C) STRANDEDNSSS : double 

(D) TOPOLOGY: linear 



35 



40 



45 



SO 



r (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 207: 
AAAAAAAAAA AAAAAnGGTG AATCTTTAAT TAAACACTAA TATTGTAAAA GATGTTAAGT 
AAACGCTTAA TGACACTTAT TTTTTGAAAA TAATAGTAAT ATCATTTTGT TAAATGAAAG 
AATAAAGCTA TAATmATTAT AGAATAACTA TTTAAAGGAG ATTATAAACA TGCCAATTAT 
TACAGATGTT TACGCTCGCG AAGTCTTAGA' CTCTCGTGGT AACCCAACTG TTGAAGTAGA 
AGTATTAACT GAAAGTGGCG CATTTGGTCG TGCATTAGTA CCATCAGGTG CTTCAACTGG 
TGAACACGAA GCTGTTGAAT TACGTGATGG AGACAAATCA CGTTATTTAG GTAAAGGTGT 
TACTAAAGCA GTTGAAAACG TTAATGAAAT CATCGCACCA GAAATTATTG AAGGTGAATT 
TTCAGTATTA GATCAAGTAT CTATTGATAA AATGATGATC GCATTAGACG GTACTCCAAA 



60 
120 
180 
240 
300 
360 
420 
480 
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AGCTGACTTA TTAGGTCAAC CACTTTACAA ATATTTAGGT GGATTTAATG GTAAGCAGTT 600. 

ACCAGTACCA ATGATGAACA TCGTTAATGG TGGTTCTCAC TCAGATGCTC CAATTGCATT SSO 

5 CCAAGAATTC ATGATTTTAC CTGTAGGTGC TACAACGTTC AAAGAATCAT TACGTTGGGG 720 

TACTGAAATT TTCCACAACT TAAAATCAAT TTTAAGCAAA CGTGGTTTAG AAACTGCAGT 780 

AGGTGACGAA GGTGGTTTCG CTCCTAAATT TGAAGGTACT GAAGATGCTG TTGAAACAAT 840 

TATCCAAGCA ATCGAAGCAG CTGGTTACAA ACCAGGTQAA GAAGTATTCT TAGGATTTGA 900 

CTGTGCATCA TCAGAATTCT ATGAAAATGQ TGTATATGAC TACAGTAAGT TCGAAGGCGA 960 

ACACGGTGCA AAACGTACAG CTGCAGAACA AGTTGACTAC TTAGAACAAT TAGTAGACAA 1020 

75 

ATATCCTATC ATTACAATTG AAGACGGTAT GGACGAAAAC GACTGGGATG GTTGGAAACA 1080 

ACTTACAGAA CGTATCGGTG ACCGTGTACA ATTAGTAGGT GACGATTTAT TCGTAACAAA 1140 

CACTGAAATT TTAGCAAAAG GTATTGAAAA CGGAATTGGT AACTCAATCT TAATTAAAGT 1200 

TAACCAAATC GGTACATTAA CTGAAACATT TGATGCAATC GAAATGGCTC AAAAAGCTGG 1260 

TTACACAGCA GTAGTTTCTC ACCGTTCAGg aAACAGAAGA TACAACAATT GCTGATATTG 1320 

2^ CTGrrGCTAC AAACGCTGGT CAAATTAAAA CTGGTTCATT ATCACGTACT GACCgTATTG 1380 

CTAAATACAA TCAATTATTA CGTATCGAgA TGAATTATTT GAAACTGCTA AATATGACGG 1440 

TATCAAATCA TTCTATAACT TAGATAAATA ATTTTCTnTA TAATCAAATG CTGACATAAT 1500 

30 TTTAGTTGAG GATTATTATG ACGGTATAAA TAAATAAAG 1539 
(2) INFORMATION FOR SEQ ID NO: 208: 
(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 84 6 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDSDNH5S : double 

(D) TOPOLOGY: linear 

40 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 208: 



4S 



SO 



CAATTTCTAT 


CTATCAATGA 


TGTGCATACT 


TCCAnTTAAA 


TTAAtCGAAA 


TGdATCAAGG 


60 


TATATCATTC 


CTGCCTCTTT 


ATATAACaAC 


AAATAGTGAT 


TACAATATTT 


CGGTTATTAA 


120 


CACGAAAATT 


TTACAAGCAC 


CTATTTCATT 


TACATATATA 


TACAGCAAAA 


AAGAAAGCCC 


180 


AQAAATATTG 


GTGTTTATTA AATCATTTAA 


AAAGTATATT 


GCCAATGAAC 


AATTATAATA 


240 


AATTTCAAAT 


CTAAAAAACC 


AAGAATGCGA 


TTAATCATCA 


CATTCTTGGT 


TCAA'rrrrAT 


300 


TCATGAATTT 


TTTCAACATT 


AAACGTTAAG 


TTATTGTCTG 


AATTTAAATT 


AACTTTAATC 


360 
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CGTTGTACAA AACGTTTTAA TGGTCTTGCA CCGTATTGAG GTTCATAAGC TTCTTGACCT 480 
AGCCAAGCTT TAGCATCATC AGAAACTTCA ATTGAGATTC GTTGTTCTAA TAATCTTATA . - 54 0 

TTTAATTGCG TTAAGATTTT ATCTACAATC ATACTCATGT CATCAATAGA TAATGGTTTA 600 

AATAATACGA TATCATCCAT ACGATTCAAA ATTTCTGGTT TGAAATATGC ATTTAAACTT 660 

GTCATAACAG CTTTTTCTGT TGATTCTGTA ATTTCACCAG TCTCTTTTAC GTTTTCTAAT 720 

AAAACTTGAG ATCCAATATT ACTTGTCATA ATAATAATAG TATTTTTAAA ATCAACGCTA 780 

CGTCCTTTAG AATCAGTTAA ACGGCtTCAT CTAAAATTTG CAATAATACA TTAAAGACGT 840 
CAGTAT 

(2) INFORMATION FOR SEQ ID NO: 209: 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1674 base pairs 

(B) TYPE: nucleic acid 
20 Iq) strandednesS: double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 209: 



846 



nTGGGAACAG 


TAAGCCAGTA 


TTTTTAGAAA 


GTTGCCATAC 


ATGAGCGTCG 


ATTTTTCCAA 


60 


TATGGCTATG 


ACACTAGAAC 


AATGGGAATT 


TGGAGGAAAA 


GTAAATGATT 


AAACCTAAAA 


120 


TAGCATTAAC 


CATTGCAGGT 


ACTGATcCaA 


CAGGTGGTGC 


CGGCGTAATG 


GCTGATTTAA 


IBO 


AATCATTTCA 


TTCATGTGGT 


GTATATGGTA 


TGGGCGTCGT 


TACAAGTmTT 


GTTGCTCAAA 


240 


ATACATTGGG 


CGTACAACAT 


ATTCATAATT 


TAAATCATCA 


ATGGGTAGAT 


GAACAACTTG 


300 


ATAGTGTCTT 


CAATGATACC 


TTACCTCATG 


CTATTAAAAC 


GGGGATGATT 


GCTACAGCAG 


360 


ATACTATGGA 

• 


AACGATTCGT 


CATTATTTAA 


TGCAACATGA 


ATCTATTCCA 


TATGTAATtG 


420 


ATCCTGTTAT 


GTTGGCGAAA 


rCggTGATTC 


ATaATGGwTA 


ATGACaCAAg 


CaAAACTTGC 


480 


AGCATaCGTT 


ATTGCCATTA 


GCTGACGTAG 


TAACACCGAA 


TTTACCAGAA 


GCTGAAGAAA 


540 


TAACGGGACT 


AACCATTGAT 


AGTGAAGAAA 


AAATTATGCA 


GGCTGGCCGC 


ATCTTTATTA 


600 


ATGAGATTGG 


TAGTAAAGGT 


GTCATCATTA 


AAGGCGGTCA 


TTCAAATGAT 


ACTGATATAG 


660 


CAAAAGATTA 


TTTATTTACT 


AACGAAGGTG 


TTCAAACATT 


TGAAAATGAA 


CGATTTAAAA 


720 


CAAnACATAC 


GCATGGAACA 


GGGTGTACAT 


TTTCAGCAGT 


TATAACGGCA 


GAACTTGCAA 


780 


AAGGTAGACC 


ATTATTTGAG 


GCTGTACACA 


AGGCTAAAAA 


GTTTATTTCA 


ATGAGTATAC 


840 


AATATACGCC 


TGAAATCGGC 


CGTGGTAGAG 


GTCCAGTGAA 


TCATTTTGCA 


TATTTAAAGA 


900 
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TGTTATACAA ACGATGTAGT TAAAAATTTT ACAGCGAATX3 GTTTATTAAG TATTGGTGCT 
AGCCCTGCAA TGAGTGAAGC TCCCGAAGAA GCTGAAGAAT TTTACAAAGT TGCACAAGCG 
CTATTAATCA ATATCGGTAC TTTAACAGCA GAAAATGAAC AAGATATTAT TGCGATTGCT 
CAAACGGCAA ATGAGGCAGG CTTACCTATT GTATTTGACC CTGTAGCTGT TGGTGCTTCT 
ACATATCGAA AGCAATTTTG TAAATTATTA TTGAAATCAG CGAAAGTATC AGTAATTAAA 
GGCAATGCAT CTGAAATATT AGCGTTGATT GATGATACAG CAACTATGAA AGGTACAGAT 
AGTGATGCTA ATCTTGATGC GGTTGCAATA GCGAAAAAGG tTACGCAACA TATAAAACTG 
CAATAGTAAT CACAGGTAAA GAGGACGTTA TTGtTCmAGA TAATAAAGCC TTCX5TATTAG 
CTAATGGATC TCCATTATTA GCACGAGTAA CTGGAGCTGG TTGTTTATTA GGAGGCGTTA 
TTGCTGGATT TTTATTTAGA GAAACAGAAC CAGACATAGA AGCGTTAATT GAAGCGGTAA 
GCgkATTTAA TATTCCTGCT GAGGTAGCTG CTGAAAATGA AAATTGTGGT GGTCCTGGTA 
CGTTTTCACC ATTGTTGCTT GATACGTTAT ATCATTTAAA TGAAACAACC TATC 
(2) INFORMATION FOR SEQ ID NO: 2X0: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2232 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 210: 
.ATGAGTTGCC GATGAATTTA GCACCACCAA CGATTGCnTT TGATACTGTG TCCCAACCAG 
CTTGTTTAGC ATATTTAATA CCTTCACGTA AAGGATCGTT ATCATATGCA GCAATACCAA 
ATACGTTATG GTATTTCGTG TTTGAGTTAG TTACAACTTT GTnTTGCACT ACATCTGCAC 

ft 

CTTTCGCTAA TTGAGAAGTA CCGTTACCTG TTTCTAATAG GGCATGTGAG ATAAGATAAA 
CTTCATTAAT GCCATACATT TGAGCAGCTT TGTTAAATGC AGCACCTTGG TTTTCTAATA 
CACCTTTACC TTTTAAGAAT TGATTAATTT TATCAATAGA AATATTTTGT GGTTGGTCTA 
AGCGTAAGAA TTGATATTTT AATGCTGGAT CTTGAOCTAA ACGCTTCGTA TCCATTGCAT 
GCTTAACATC ATTAAATTTA GCATCTGTCC ACTTACCTGG TACACGTTGT ACTTGTGGTT 
TATATTGTAA ACCAGCTTGT ATTTGAGCAA CTTGGTTTAA TGTCATACCT GTTTGATTAT 
ACTTAATTAA TTCTTTAGCT AAATCAGTTG ATTTAATCCA TGCtAATTTA CCGTTAGATA 
ATTTACCATA GTACCAAGTT TGTCCATTAA TGACTTGTTC TTTAACAACT GCGAATGGTT 
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10 



15 



20 



AACCATTACC ATTTTTAATT ACATAAGTGT AGTTATAATC TTTGGcAGCT GATGTAGTTG 
GTTTCACAGC AGTTGGTGCA GTTAAATCTT TTGCATTTAC CCAACCAGTG CGGTTATTAA 
TAGTACCGTA TAAATAAACA TCTTTGCCTA CAGATACTTG TTTCGTTGCA TTAAATGTAC 
CTTGAGCAAT GTTATTGCCT GTTAAAATGA CTTGGTTTTr AGTACCCCAA GGAACCATTG 
ATAAGCCGTT ATTTGATTTA TTAACAGTAT ATTTTTGAGT CGTTTTAACT TCTTTGCCTA 
AGTTTTGAAC ATTTAAGTCT TTTACATTGA ACCAACCTAA TGGGATGTTA TGGCTTGTAT 
' TGTTTAATAA TACATACGTT TCATTACCAT GAGCACGCTC TTTTGTTACA TAGAACGTAC 
GGTCTGCATA TTTCGCACCG TTTTTCGCTG TTTTTTCATA AACAGAAGCA CGAATACCAG 
TGTTGTTTGG TTTAACTTGA GCAATCTTGC TAACTGTTTG AGTCGTTTGT GGTTTAGTAA 
CAGTATAAGC TTTTACAGCT GTTTTTGGTT GTGCTACTGC TTTTTTAGGT GCAGCAGGTA 
CAGCTAAATA TGCTTTACTT ACCCAACCAG ATTTACCATT TACAGTTCCA AATAAATAGA 
TAGATTTATC AATTTGTTGT TGCTTAGTCG CTTTAAAAGT TTGGTTACCT GTACCAGAAA 
CTGCACCAGC TTCTTGTTTA TAAGTGCCCC AAGGTACTGA ATATAATTTA GTGCCTGGgT 
TTACTGTATA TGTTTGCATT ACATTTACAG GTGATTTTGC ATtGtTATAA ATACGTCACC 
TTGTTTAACC CAACCAATTA AAGTTGGACT ATTGTAATCT TTAACTAAGT AGAATTTGTT 
TCCACCTAAA CTTGCTTCTT TTGTTACAGC AAATGTTTTT TGAACTTCTT TCGTTGGCTT 
ACCAGTTTTG TCATAAACTG TAGTGAATAA GCCATTGTTT TTAGCATTAA TTTGAGCAAC 
ACCGTTTAAT GATGAAACTG TTAATTTATT ATTTGTTGTA GGTGTTGATG GCTTAGGTGT 
TGGTGTAGGC GTAGGTTTAG CAGTATCAAC TAAATATGCT TTACTTACCC AACCAGATTT 
ACCATTCACA GAGCCATATA AATAAATTGA TTTATCAATT TGTTGTTGCT TTGAAGCCTT 
AAATGTTTGG TTTCCAGAGC CAGACACACT ACCAGCAACT TGTTTAGATG TACCCCAAGG 
TACTGTATAA AGTTTCGTAC CAGGTTTGAT TGAATATGAT TGATTTACAT TTACAGGTGA 
TTTAGCTGTG TTGTAAACCA CATCGCCTTC TTTAACCCAA CCAAATTTAT TACCAGAATT 
45 GTAATCTTGA ACAAGATAGA ATTTTTGATT ACCTAATGTA GCTGTTTTAG ATACAGCAAA 

TGTTTTTTGA ACTTCATTAG TTGCTTTACC AGTTTTGTCG TATACAGTAG TATATAAACC 



2S 



30 



3S 



40 



SO 



55 



ACTATTTGTT GG 

(2) INFORMATION FOR SEQ ID NO: 211: 
(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH:. 2082 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 



780 
840 
900 
960 
1020. 
1080 
1140 
1200 
1260 
X320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 
1920 
1980 
2040 
2100 
2160 
2220 
2232 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 211: 
GATTTAAATA AAATTAATGG ATATCGTGAT CGTACGATGT TAGAACTTCT GTACGCAACG 
GGAATGCGTG TATCTGAATT GATACATTTA GAGTTAGAAA ACGTGAACTT AATAATGGGA 
TTTGTACGCG TATTTGGTAA AGGCGATAAA GAAAGAATTG TACCATTAGG CGACGCAGTC 
ATTGAGTACT TAACTACTTA TATTGAAACG ATTAGACCGC AACTTTTAAA AAAGACTGTT 
.ACTGAAGTCT TATTTITAAA TATGCATGGT AAACCTTTAT CACGACAAGC AATATGGAAA 
ATGATTAAAC AAAATGGTGT. AAAGGCAAAC ATTAAAAAGA CGTTAACGCC ACATACGTTA 
CGCCACTCTT TTGCGACACA TTTATTGGAA AATGGCGCAG ATTTAAGAGC AGTGCAAGAG 
ATGTtAGGtC ACTCTGaCmT ATCTACTACC CmaCTCTATA CmCATGTTTC GrAATCTCAA 
ATTAGAAAAA TGTATAACCA ATTTCATCCT AGAGCATAAA GTGAACAATA ACTCAAAAGT 
CACAATACAC ATGACTAAAA ATGTCTGTGC TATTGTGGCT TTTTTAAATT GGTTGATTAA 
TTACGTCTAT GTTTTCTTAA TTGAATCGCT TCTXCTTTTG CTGCAATCAC TTCTGAACGA 
TCACGGCGCA TGTGATGGTC TACAATAAAA GGATCTGTTG CTGTTTCCTG ATTATAATCA 
TAGTCTGGAT AGTTGGCCTT GATGATGCGT TCAAAGACTG GAGTTATTGG TAATATAACA 
GATGAAAAAG GCTTTGCTGC ATTCAATTTT GCAATCTGTT GCTCAATTAA CAACTGATAA 
TCATTTAAAT TAAGGTATAA CGCATCTCXA TCTTTAGCAT TTTGTATTAT TTCTTTAGAT 
TTATTAAAAG ACTTATAGGC GCCTTTTAAA TTATTGCGGC GATAATGGTA ACAAGCAGTT 
GCAAACAAGA TTAAACTAAC AACTGCATCT TGCTTACTGT AGTTATTTTC AGCTTTCCAT 
GCATCTTCTA AAATGTCATG ACATAGGAAA TAATGTTGCT TAGTATGAAA TTGATAATAG 
AAACTTATCA GTGCCTGTTG CATTTTGTTA TCACCCCAAT TTAAAAGTAA GTTATTTTCA 
TGCTATAATA TTTTAGAGAA TTATGCACAT ATGACGCAAT ACGAGGTAGA TATTATGTAT 
GAAGTTAAAT TAGATGCTTT CAATGGACCA TTAGATTTAT TGCTGCATCT TATCCAAAAA 
TTTGAAATAG ATATTTATGA TATTCCTATG CAAGCATTAA CAGAGCAGTA TATGCAGTAC 
GTTCATGCAA TGAAACAGCT TGAAATTAAT ATTGCAAGTG AATACCTAGT ATTAGCGTCA 
GAACTCTTAA TGATTAAAAG TAAGATGCTA TTACCACAAT CAACATCAGA TATGGATGTT 
GATGATGACC CACGGGAAGA TTTAGTtGGG CGTTTAATAG rATATCaAAA TTATArAGAA 
TATACTGCtA TTTTAAATGA CATGAAAGAA GAAAGAGATT TTTATTTTAC CAAAAAGACC 
GACAGATTTA TCtCATTTGG AAAcAGATGA ATCyTGGGAT CCaAATCATA CGATTGATTT 



953 



EP0 786 519 A2 

ATCTGTTGAA ATCCGAAAAG AGACATTTAC CATTCAACAA GCTACAGAAC AAGTGACATC 

GAGATTGAAA GATAAAGATC ATTTTAACTT CTTTAGTCTG TTTACGTTTT CTGAGCCAAT 

TGAACAAGTA GTCACTCACT TTTTAGCTAT TTTAGAGATG TCAAAAGCAG GAATAATTAA 

TATTGAGCAA CAACGTAATT TTGAAGATAT TAACATTATT AGAGGAGTGA ACTACCATTT 

TGGATAATCA TGGTATATTA GAGTCGCTTT TATTTACAGC TGGCGATGAA GGTTTAGATG 

AAAAACAACT ATTAGAAATA TTAGATATGT CGAAAGACCA ACTCGTTGAA TTAATTGAAA 

ATTATTCATC ACATGGATTA ATGATACAAC GATTTGGAAT GA 

(2) INFORMATION FOR SEQ ID NO: 212: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4219 base pairs 
* (B) TYPE: nucleic acid 

(C) STRANDEONESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 212: 
TCTATTCTCG TTCTTCCAAG ACCCTGaATT AGAAGTTAAG AAAATCGAAG AAGATGAGAA 
AGAATCTATT AAAAAAGCTC AAAAAGGTAT TTATAAAGAC CCTAGAGACA TCAATGATGA 
CGAACAAGAT GATGATACAA AAGATACTGT TGATAAAAAG GAATGATTGT. AATTGCCTAA 
CAAAAACACT CAAGAATATT GGGAAGAACG CGGACGCAAA GCAATCGAGA ATGAGTTGAA ■ 
GCGTGATAAA ACTAAAGCTG AAGAAATAGA ACGTATATTG AATATGATGA TTAAGCGCAT 
TGAAAAAGAG ATCaATGCGT TTATTGTCAA GTACGGAGAT TTTGCAGGCG TTACATTACA 
AGAAGCACAA AAGATTATTG ATGAGTTCGA TGTAAAAGCG TTTCAAGAAG AAGCAAAAAG 
ATTGG3'CGAA AACAAGGAGT TTAGCGATAG AGCAAATGAA GAATTAAAGA AGTATAACAC 
GAAAATGTAT GTATCTAGAG AACAGATGTT AAAGATTCAA ATAGAATTCT TAATTGCTTA 
TGCAACAGCT CAAACAGAAT TATCGATGAG GGAATATTTC GAATCAACAG CTTATCGTGT 
GTTCAGTGAT CAAGCGGGTA TTTTAGGTGA AGGTGTACAA GTAGCTAAAG AAGTTATAGA 
TACAATCGTT GATACACAAT TTCATGGTGT CGTTTGGTCA GAGCGATTAT GGACTAATAC 
CGAAGCAATG AAACAAGAAG TAGAAGAAAT AATTGCTAAT GTAGTTATTA GAGGTCGACA 
TCCTAATGAA TATGTTAAAG ATATGCGCAA CACTTAAATA AATTCGAAGG CACAGCACGA 
CAAAAGACCG CAGCAATTAA ATCATTGCTT TATACGGAAT CGGCACGTGT TCACGCACAA 
TCAAGCATTG ACAGCATGAA AGAAATTTCA CCGGAAGgAT ATTATATGTA TATTGCAAAA 
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GACGCTAAAA 


TTGGTGTTAA 


. TTTCTATCCT 


ATGCATATCA 


ATTGTCGTTC 


AGATTGCGCT 


1080 




TTACTACCTA 


AATCTATGTG 


GCCGAAAAAA 


CCAAGCAAGA 


AACGAAAAAC 


AAAATACTTC 


1140 


s 


GGAGGGAAAG 


TGAAAAGCGG 


TGATTGATTT 


. AAAAGTGAAG 


TTTTTTAAAG 


GCAAGTTAGT 


1200 




TTTGTATGAC AGTAAATTAA ATGTTTGGAG GATACTAATA TGAGTAATAC TGACAAATAC 


1260 


10 


CTTAGAGACA 


TAGCAAGAGA 










1320 


ACAGTTATTA 


TTGATGCAAA 


CTTAGACAGT 


TTAAGGTCGG 


CAGTATTAGC 


CGATAAAGAA 


1380 




AAATCGAAAT 


ATAATGAACC 


TCTCTTTTAA 


TAGCTAGCAC 


TTAATTGTGT 


TGGCTATITT 


. 1440 


IS 


TTATGTCCAA AACGTGCTGA 


TGACATAAAA 


AGCAC6CATG 


GAA7VAACAGT 


CGACAGACTA 


1500 




TAAATGGAGG 


TATATCTCAT 


GGAAGAAAAT 


AAACTTAAGT 


TTAATTTGCA 


aTTTTTTGCA 


1560 




GACCAATCAG 


ATGATCCGGA 


CGAACCAGGC 


GGAGATGGTA 


AAAAAGGAAA 


TCCTGATAAG 


1620 


20 


AAAGAAAATG 


ACGAAGGTAC 


TGAAATAACT 


TTCACGCCAG 


AGCAACAAAA 


GAAAGTTGAT 


1630 




GAAATACTTG 


AACGTCGTGT 


AGCCCACGAA 


AAGAAAAAAG 


CTGATGAGTA 


TGCAAAAGAA 


1740 


25 


AAAGCAGCAG AAGCTGCTAA AGAAGCTGCT AAATTAGCGA AAATGAACAA GGATCAAAAA 


1800 


GATGAATATG 


AACGCGAACA 


AATGGAAAAA 


GAACTGGAAC 


AATTACGTTC 


AGAAAAACAA 


1860 




TTAAACGAAA 


TGCGTTCAGA 


AGCACGAAAA 


ATGTTGAGTG 


AAGCGGaAGT 


TGATTCATCA 


1920 


30 


GATGrGGTTG 


TCAATTTAGT 


TGTAACAGAT 


ACTGCTGAAC 


AAACTAAATT 


GAATGTTGAA 


1980 




GCTTTTTCTA 


ATGCAGXAAA 


AAAAGCGGTT 


AATGAAGCGG 


TTAAGGTTAA 


CGCTAGACAA 


2040 




TCGCCATTGA 


CTGGTGGAGA 


TTCATTTAAT 


CACTCGACTA 


AAAATAAACC 


GCAAAACTTA 


2100 


3S 


GCTGAAATAG 


CTAGACAAAA 


AaGAATTATT AAAAATTAAC 


GGAGGCATTT 


AAATGGAACA 


2160 




AACACAAAAA 


TTAAAATTAA 


ATTTGCAACA 


TTTTGCAAGT 


AACAATGTTA 


AACCACAAGT 


2220 




ATTTAACCCT 


GACAATGTAA 


TGATGCATGA 


AAAGAAAGAT 


GGCACGTTGT 


TAAACGACTT 


2280 


40 


TACAACACCT 


ATCTTACAAG 


AGGTTATGGA 


AAACTCTAAA 


ATCATGCAAT 


TAGGTAAGTA 


2340 




CGAACCAATG 


GAAGGTACTG 


AGAAGAAGTT 


TACTTTTTGG 


GCTGATAAAC 


CAGGTGCTTA 


2400 


4S 


CTGGGTAGGT 


GAAGGTCAAA 


AAATCGAAAC 


GTCTAAGGCT 


ACTTGGGTTA 


ATGCTACAAT ' . 


2460 


GAGAGCGTTT 


AAATTAGGGG 


TTATCTTACC 


AGTAACAAAA 


GAATTCTTGA 


ATTACACTTA 


2520 




TTCACAATTC 


TTTGAAGAAA 


TGAAACCTAT 


GATTGCTGAA 


GCTTTCTATA 


AAAAGTTTGA 


2580 


SO 


CGAGGCAGGT 


ATTTTGAATC 


AAGGTAACAA 


TCCGTTCGGT 


AAATCAATTG 


CACAATCAAT 


2640 


« 


TGAAAAAACT 


AATAAGGTTA 


TTAAAGGTGA 


CTTCACACAA 


GATAACATTA 


TTGATTTAGA 


2700 




GGCATTGCTT 


GAAGATGACG 


AATTAGAAGC 


AAATGCATTT 


ATCTCAAAAA 


CACAAAACAG 


2760 
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TGATTCGTTA GACGGTCTAC CTGTGGTTAA CCTTAAATCA AGCAACTTAA AACGTGGTGA 2880 

ATTAATCACT GGTGACTTCG ACAAATTGAT TTATGGTATC CCTCAATTAA TCGAATACAA 2940 

AATCGATGAA ACTGCACAAT TATCTACAGT TAAAAACGAA GATGGCACAC CTGTAAACTT 3000 

GTTTGAACAA GACATGGTGG CATTACGTGC AACTATGCAT GTAGCATTGC ATATTGCTGA 3060 

TGATAAAGCG TTTGCTAAGT TAGTTCCTGC TGACAAAAGA ACAGATTCAG TTCCAGGAGA 3120 

AGTTTAATAA ATAATTAGGA GTGGTAACAT GCCCGAAATC ATTGGAATTG TTAAAGTAGA 3180 

TTTTACAGAT TTAGAAGATA ACAGACATGT CTATATGAAA GGGCATGTCT ACCCTCGTAA 3240 

AGGTTATAAT CCTACAGATG AACGTATCAA AGCTTTAGCT AGTGTTGAAA ATAAACGCAA 3300 

CAAACAAATG ATTTACATTG TAAATGACAA ATTAACCAAA AAAGAACTTG TCGAAATAGC 3360 

AAGTGTTGCT GGCTTACAAG TTGATGAAAA ACAAACAAAA GCTGAAATTA TCAATGCTTT 3420 

20 TGAGTCACTA GAGTAGGTGG TTATATGACT ACGCTAGCTG ATGTAAAAAA ACGTATTGGT 3480 

CTTAAAGATG AAAAGCAAGA TGAACAATTA GAAGAAATCA TAAAAAGTTG TGAAAGCCAG 3540 

TTGTTATCAA TGTTACCTAT TGAAGTTGAA CAAATACCGG AAAGgTTTAG TTACATGATT 3600 

AAAGAAGTTG CAGTTAAACG CTACAACAGG ATTGGTGCTG AAGtATGACA TCAGAAGCGG 3660 

TTGACGGACG TAGCAATGCG TATGAATTGA ACGATTtCAA GGAGTATGAA GCTATTATTG 3720 

ATAATTACTT TAATGCTAGA ACGAGAACTA AAAAAGGAAG GGCTGTGTTC TTTTGAGATA 3780 

TGAAGATAGA GTTATTTTTC AATTAGAACA AGTAGCAACT TACAATCCTA AAACTAGCAA 3840 

AAAAGAAAAC ACACTAATCA CTTATGATGC GATACCATGC AATATTAACC CCATTTCTAG 3900 

35 AGCAAGAAAG CAACTTGAAT TTGGTGATGT AAAAAACGAT GTAAGTGTTC TGAGGATAAA 3 960 

AGAATCAATA TCTTACCCTG TTAGCCACGT GTTGGTTAAT GGCATTCGCT ACAAGATAGT 4020 

TGAmCAAGG ATATACAGAC ACGAAACX3TC ATATTATATC GAAGAGGTCA ATTGATGAAT 4080 

ATAGATGGAT TAGACGCACT GTTAAACCAA TTTCACGATA TGAAAACCAA CATTGATGAT 4140 

■ 

GATGTAGATG ATATTTTACA GGAAAACGCC AAAGAATATG TAGTACGAGC TAAATTGAAA 4200 

GCTAGAGAAG TAATGAATA 4219 

45 

(2) INFORMATION FOR SEQ ID NO: 213: 

(i) SEQUENCE CHARACTERISTICS: 

{A) LENGTH: 1999 base pairs 
(3) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 
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GCTTACAAGT 


ATATTCATAA 


TTACATATTC 


AAGGTCCTTG 


CATGTGGTAT 


TTTGCTATGG 


60 




yCtTTaACTA CAACGGGGTC TAAGACTGCG TTTATCATAT TAATCX5TCTT AGCCATTtAT 


120 


5 


TyCTTTATkA AAAAGTTATT TAGTAGAAAT GCGGTAAGTG TTGTGAGTAT GTCAGTGATT 


180 




ATGCTGATAT 


TACTTTGTTT 


TACCTTTTAT AATATCAACT 


ACTATTTATT 


CCAATTAAGC 


240 


10 


GACCTTGATG 


CCTTACCGTC 


ATTAGATCGA 


ATGGCGTCTA 


TTTTTGAAGA 


GGGCTTTGCA 


300 


TCATTAAATG 


ATAGTGGGTC 


TGAGCGAAGT 


GTTGTATGGA 


TAAATGCCAT 


TTCAGTAATT 


360 




.AAATATACAC 


TAGGTTTTGG 


TGTCGGATTA GTGGATTATG 


TACATATTGG 


CTCGCAAATT 


420 


15 


AATGGTATTT 


TACTTGTTGC 


CCATAATACA 


TATTTGCAGA 


TCTTTGCX5GA 


ATGGGGCATT 


480 




TTATTCGGTG 


CATTATTTAT 


CATATTTATG 


CrrTATTTAC 


TGTT7GAATT 


ATTTAGATTT 


540 




AACATTTCTG 


GGAAAAATGT 


AACAGCAATT 


GTTGTAATGT 


TGACGATGCT 


GATTTACTTT 


600 


20 


TTAACAGTAT 


CATTTAATAA 


CTCAAGATAT GTCGCTTTTA 


TiTl'AGGAAT 


TATCGTCTTT 


660 




ATTGTTCAAT 


ATGAAAAGAT 


GGAAAGGGAT 


CGTAATGAAG 


AGTGATTCAC 


TAAAAGAAAA 


720 




TATTATTTAT 


CAAGGGCTAT 


ACCAATTGAT 


TAGAACGATG 


ACACCACTGA 


TTACAATACC 


780 


CATTATTTCA 


CGTGCATTTG 


GTCCCAGTGG 


TGTGGGTATT 


GTTTCATTTT 


CTTTCAATAT 


840 




CGTGCAATAC 


TTTTTGATGA 


TTGCAAGTGT 


TGGCGTTCAG 


TTATAlTiTA ATAGAGTTAT 


900 


30 


CGCGAAGTCC 


GTTAACGACA AACGGCAATT 


GTCACAGCAG 


TTTTGGGATA 


TCTTTGTCAG 


960 




TAAATTATTT 


TTAGCGTTAA 


CAGTTTTTGC 


GATGTATATG 


GTCGTAATTA 


CTATATTTAT 


1020 




TGATGATTAC 


TATCTTATTT 


TCCTACTACA 


AGGAATCTAT 


ATTATAGGTG 


CAGCACTCGA . 


1080 


35 


TATTTCATGG 


TTTTATGCTG 


GAACTGAAAA 


GTTTAAAATT 


CCTAGCCTCA 


GTAATATTGT 


1140 




TGCGTCTGGT 


ATTGTATTAA 


GTGTAGTTGT 


TATTTTTGTC 


AAAGATCAAT 


CAGATTTATC 


1200 




ATTGTATGTA 


TTTACTATTG 


CTATTGTGAC 


GGTATTAAAC 


CAATTACCTT 


TGTTTATCTA 


1260 


40 


TTTAAAACGA 


TACATTAGCT 


TTGTTTCGGT 


TAATTGGATA 


CACGTCTGGC 


AATTGTTTCG 


1320 




TTCGTCATTt 


AGCATACTTA 


TTACCAAATG 


GACAGCTCAA 


CTTATATACT 


AGTATTTCTT 


1380 


45 


GCGTTGTTCT 


TGGTTTAGTA 


GGTACATACC 


AACAAGTTGG 


TATCTTTTCT 


AACGCATTTA 


1440 


ATAITITAAC 


GGTCGCAATC 


ATAATGATTA ATACATTTGA 


TCTTGTAATG 


ATTCCGCGTA 


1500 




TTACCAAAAT 


GTCTATCCAG 


CAATCACATA GTTTAACTAA AACGTTAGCT 


AATAATATGA 


1560 


SO 


ATATTCAATT GATATTAaCA ATACCTATGG TCTTTgGTTT AATTGCaATT ATGCCATCAT 


1620 




TTTATTTATG 


GTTCtTTGGT 


GAGGAATTCG 


CATCAACTGT 


CCCATTGATG 


ACCArriTAG 


1680 




CGATACTTGT ATTAATCATT CCTTTAAATA tGTTGaTAAg 


CaGGCAATAT 


TTAtTAAtAG 


1740 
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TATGTAyTAT TTTGATATAT TTTTATGGAA TTTACGGTGC TGCTATTGCG CGTTTAATTA 1860 

CAGAGmTT CTTGCTCATT TGGCGATTTA TTGATATTAC TAAAATCAAT GTGAAGTTGA ' 1920 

ATATTGTAAG TACGATTCAA TGTGTCATTG CTGCTGTTAT GATGTTTATT GTGCTTGGTG 1980 

TGGTCAATCA TTATTTGCC 1999 



(2) INFORMATION FOR SEQ ID NO: 214: 

- • 

10 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 7769 base pairs 

(B) TYPE: nucleic acid 
(C> STRANDEDNESS : double 
(D) TOPOLOGY: linear 

IS 

(xi) SEQUENCE DESCRIPTION: SEQ 10 NO: 214: 
20 TCATTATTAA GACTATTATA TATAATGAAT TTTAACTGGT TTATTAAACG AGAACGTCGG 60 

GAATTAAGTA ACTACAATAA AAATAAGATA TGACAATAAG GAGACTACAC GCGTGATCAT 120 
TGCCATAATT ATATTGATAT TTATTTCGTT TTTCTTTTCA GGAAGCGAGA CGGCATTAAC 180 
GGCTGCCAAT AAAACAAAAT TTAAAACTGA AGCTGACAAA GGTGATAAAA AAGCAAAAGG 240 
CATTGTAAAG TTACTTGAAA AACCAAGTGA GTTTATTACA ACGATTCTAA TTGGGAATAA 300 
TGTCGCGAAT ATTTTATTAC CAACACTTGT TACAATTATG GCTTTACGTT GGGGGATTAG 360 

30 

CGTTGGTATT GCATCAGCTG TTTTAACAGT TGTTATCATT. TTGATCTCCG AAGTGATTCC 420 
CAAGTCTGTC GCTGCAACAT TTCCAGATAA AATAACAAGG CTTGTATATC CAATTATTAA 480 
35 TATTTGTGTC ATTGTGTTCC GTCCTATCAC ATTACTTTTA AATAAGTTGA CGGACAGTAT 54 0 

TAATCGAAGT TTATCTAAGG GCCAACCTCA AGAACATCAA TTTTCAAAAG AAGAATTTAA 600 
AACAATGTTA GCAATTGCTG GACATGAAGG TGCTTTAAAT GAAATTGAGA CGAGTAGGTT 660 
GGAAGGTGTC ATTAATTTTG AAAATTTAAA AGTAAAAGAT GTAGATACAA CACCTAGAAT' 720 
TAATGTGACG GCATTTGCTT CAAATGCGaC ATACGAAGAA GTTTATGAAA CGGTTATGAA 780 
TAAGCCATAC ACTAGATATC CAGTGTACGA GGGAGATATT GATAACATTA TTGGGGTGTT 840 

4S 

TCATTCTAAA TATCTGTTGG CTTGGAGTAA TAAAAAAGAA AATCAAATTA CAAACTATTC 900 
AGCTAAGCCA TTATTTGTGA ATGAACACAA TAAAGCTGAA TGGGTATTAC GTAAGATGAC 960 
TATTTCTAGA AAACATTTAG CAATTGTGTT GGACGAATTT GGTGGTACTG AAGCGATAGT 1020 

50 

GTCACATGAA GACTTAATTG AAGAATTATT AGGTATGGAA ATTGAAGATG AGATGGATAA 1080 
AAAGGAAAAA GAAAAACTTT CTCAACAGCA AATTCAATTT CAACAACGGA AAAATCGCAA 1140 

55 
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GTATTGAATA TCCAATTATA CAAGCAGGTA TGGCAGGAAG TACGACACCG AAATTAGTTG 
CATCAGTAAG TAACAGTGGT GGGTTAGGCA CAATAGGCGC AGGTTACTTT AATACGCAGC 
AATTGGAAGA TGAAATAGAT TATGTACGCC AATTAACGTC AAATTCTTTT GGCGTAAATG 
TCTTTGTACC AAGTCAACAA TCATATACCA GTAGTCAAAT TGAAAATATG AATGCATGGT 
TAAAACCTTA TCGACGCGCA TTACATTTAG AAGAGCCX5GT TGTAAAAATT ACCGAAGAAC 
AACAATTTAA GTGTCATATT GATACGATAA TTAAAAAGCA AGTGCCTGTA TGTTGTTTTA 
CTTTTGGAAT TCCAAGCGAA CAGATTATAA GCAGGTTGAA AGCAGCGAAT GTCAAACTTA 
TAGGTACAGC AACAAGTGTT GATGAAGCTA TTGCGAATGA AAAAGCGGGT ATGGATGCTA 
TCGTTGCTCA AGGTAGTGAA GCAGGTGGAC ATCGTGGTTC ATTTTTAAAA CCTAAAAATC 
AATTACCTAT GGTTGGAACA ATATCTTTAG TGCCACAAAT TGTAGATGTC GTTTCAATTC 
20 CGGTCATTGC CGCTGGTGGA ATTATGGATG GTAGAGGAGT TTTGGCAAGT ATTGTCTTAG 
GTGCAGAAGG GGTACAAATG GGCACCGCAT TTTTAACATC ACAAGACAGT AATGCATCAG 



15 



25 



AACTACTGCG AGATGCAATT ATAAATAGTA AAGAAACAGA TACAGTCATT ACAAAAGCGT 
TTAGTGGAAA GCTTGCACGC GGTATCAACA ATAGGTTTAT CGAAGAAATG TCCCAATACG 
AAGGCGATAT CCCAGATTAT CCAATACAAA ATGAGCTAAC AAGTAGCATA AGAAAAGCCG 
CAGCAAACAT CGGCGACAAA GAGTTAATAC AXATGTGGAG TGGACAAAGC CCGCGACTAG 
CAACAACGCA TCCCGCCAAC ACCATCATGT CCAATATAAT CAATCAAATT AATCAAATCA 
TGCAATATAA ATAATCGACC GCAATCCACA AAAGCACAAG CACCCCCAAA CATTATTTTA 
35 GTGCTTGCCA TTTTTGTGGA TTGCGTTTCT ATTTTACCAA TTTAATCAAA CGAAAACATC 
AAGCTGAAGA TCGCCGAAAG ATTTTAATCA AGCAAAAACA TCAAACTAAA GTTCGCTGAA 



30 



40 



45 



$0 



ATGATTATGA TAAAAGTTAT ATGGTATGAT GACATTGGTG ATATATATGA TAAACATCGG 
ATTAACAGGT TGGGGTGATC ACTATTCATT ATATGAAGAT TTAGAACGCC AAACCGATAA 
ACTTAAAACA TATGCTGGAC ATTTTCCGGT TGTCGAATTA GATGCGACAT ACTATGCGAT 
ACAACCGGAA AGAAATATAT TGAAATGGAT AAAAGAAACG CCTGATACAT TTGAATTTGT 
GGTCAAAATT CATCAAGCAC TcACATTGCA TGCAGACTAC AAAACATTTG CAGATACAAG 
GCAAGAACTA TTTGATCAAT TTAAGAATAT GTTAGAGCCC TTACATACAC AGAAAAAATT 
AGCAATGGTA TTGGTTCAAT TTCCGCCATG GTTTGACTGC AATGCACAAA ATATCAAATA 
TATTTTGTAT GTAAGACAGC AATTACAAGC ATTTCCAATG TGTGTAGAAT TTAGGCATCA 
ATCATGGTTT AGTGATGCAT TTAAAGAACA AACATTGGCA TTTTTAACAG AACATCAAAT 



1260 
1320- 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 
1920 
1980 
2040 
2100 
2150 
2220 
2280 
2340 
2400 
2460 
2520 
2580 
2640 
2700 
2760 
2820 
2880 
2940 
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AATCACAAAT GAAATTGCGT TTGTACGTTA TCATGGACGT AATCATTACG GTTGGACTAA 3060 

GAAAGATATG TCAGATCAAG AATGGCGCGA TGTACGCTAT TTATATGATT ATAATGAGCA 3120 

AGAATTAATA GACTTGGCAC AAAAGGCACA AATATTAGCA CAAAAAGCTA AGAAAGTTTA 3180 

CGTCATATTT AACAATAATT CTGGTGGTCA TGCAGCAAAT AATGCCAAAA CATATCAGCG 3240 

ATTATTGAAT ATAGAATATG AAGGGTTAGC ACCACAACAA TTAAAATTAT TTTAAGAGGC 3300 

GACGACTATG TTATTAACAA TTACATTATT AGTTTTAATC GGAGGTTTGT CAGCGATTAT 3360 

AGGGTCTATC GTAGGCATTG GAGGCGGTAT TATTATCGTT CCAACAATGG TTTACCTCGG 3420 

TGTTGAACAT GGATTACTAC ATAATATTAC AACACAAGTA GCGATAGGGA CGTCTTCAGT 3480 

CATTCTAATT GTGACAGGAC TTTCTTCATC ACTTGGATAT TTAAAAACAA AACAAGTTGA 3540 

TATTAAAAAT GGTTCCATCT TTTTATTTGG ACTATTACCA GGTTCATTGC TTGGGTCCTT 3600 

20 CATTAGTAGA TATTTAACAT TTGAGTCATT TAATTTATAT TTTGGTATCT TTTTAATTTT 3660 

CGTAGCCATT TTATTAATGG TAAGAAATAA GATTAAACCG TTTAAAATTT TCGATAAACC 3720 

CAAGTATGAA AAGACTTATG TAGACGCTAA AGGTAAAACA TATCATTATA gTGTTCCACC 3780 

ATTGTTTGCT TTTATTACAA CGTTTTTAAT TGGTATATTG ACAGGTTTAT TTGGTATTGG 3840 

AGGTGGCGCA CTAATGACGC CACTAATGCT TATTGTATTT AGATTTCCAC CTCATGTAGC 3900 

TGTTGGAACA AGTATGATGA TGATTTTCTT TTCAAGTGTC ATGAGTTCTA TAGGGCACAT 3960 

TGCTCAAGGT CACGTAGCTT GGGGTTATGC AATCATnTTA ATTATTTCTA GTTATTTTGG 4020 

TGCGAAAATC GGTGTCAAAG TGAATCAATC AATTAAGTCA GATACGGTAG TAACATTATT 4080 

35 GAGAACAGTA ATGTTSTTAA TGGGTATATA TTTAATTATT CGTGCGTTGA TTTAATACAA 4140 

CTTTAAAAGG AGGACGTCAA TTTGAGGCTT ACAATTTATC ATACGAACGA TATTCATAGT * 4200 

CATT?ACATG AATACGAACG CATTAAAGCA TATATGGCAG AACATCGGCC ACGACTTAAT 4260 

CATCCTTCTT TATATGTTGA TCTAGGTGAT CATGTAGATT TATCCGCACC TATAACTGAA 4320 

GCAACTTTAG GTAAAAAGAA TGTGGCATTA CTAAATGAAG CAAAATGTGA TGTTGGAACA 4380 

ATCGGTAATA ATGAAGGGAT GACCATTTCA TACGAAGCTT TAAATCACCT TTACGACGAA " 4440 

GCAAAATTTA TAGTGACATG TAGCAATGTT ATAGATGAAT CAGGTCATTT ACCAAATAAT 4500 

ATCGTTTCTT CTTATATTAA GGACATAGAC GGTGTGAAAA TACTATTCGT TGCAGCGACA 4560 

GCACCTTTTA CCCCATTTTA TCGTGCACTA AATTGGATTG TTACCGATCC ACTTGAATCT 4620 

ATAAAAGAAG AAATTGAACT TCAACGAGGT AAATTTGATG TATTAATCGT GCTAAGTCAT 4680 

TGTGGCATTT TCTTCGATGA AACATTATGC CAAGAATTGC CTGAAATTGA TGTCATTTTT 4740 
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GCAgCTGGAA AGTATGGTAA TTATCTTGGA 
GTAGTACATA AAACTGCAAA GATTATTCCT 
TTTGAAGAAG AAGGAAAAAC GTTAATGTCC 
AAGCGTAGTA TGAATCACAT AACTGAAGCT 
TATACACATG CACAATGTGC CATCATCAAT 
GATGAAGTGA CAGAATATGA CATTCATCAA 
GTTAGACTTT TTGGTGTGAA ATTAAAAGAG 
ATGTATGAAC ATGCACAAGG TTTGGGTTTC 
TATAATTTAG GGTACATTCA TTCTACAGGG 
GACGACAAAG AATATGTACT AGGTACGATA 
ACATTGAAAG AATTACCAAA AGAGTATTTA 
GAAAAATTAT TGGAATATTA AAAAGTAAGA 
ATATAATGTT TAAAGATACA CTTAACAGGA 
AGGAAATATT ACGTAAACCG GATTGGTTGA 
CAGGACTTAA GAAGATGATG AGGGAAAAAA 
GTCCTAATAT ACATGAATGT TGGGGTGCAC 
CCGTATGTAC AAGAGCTTGT CGTTTTTGTG 
ATTTAAATGA GCCTGAACGT GTAGCTGAAT 
TTATCACTGC TGTTGCGCGT GATGATTTAA 
CAGTACGTAA AGTTAGAGAA AGAAATCCAT 
TGGGCGGGGA CTATGATGCG TTAGAAACAT 
ATAATATTGA AACTGTTCGT CGCTTAACAC 
GAACATTAGA GTTTTTACGT CGTTCAAAAG 
GTATTATGGT TGGATTAGGT GAAACTATAG 
GTGCGAATGA TGTAGATATT TTAACGATTG 
TAAAGGTTCA AAAATATTAC ACGCCTTTAG 
ATAAAGGGTT TAAACATTGC CAAGCTGGAC 
AGCAAGTAAA TGAAGCTGCT AAAGAAAAGC 
AATATTTAAC CATTAATAAG GCATAAAGGC 



GAGGTTAATT TAACTTTTGA GGCACATAAA 
TTAGAAACAT TACCTGAAGT TGAAACTTCA 
AATTCAGTAA TTCAACATCC AGTAGTGCTT 
GCATACTTAT TAGCTCAAAG TGTTTGTGAG 
GCTGGCTTAC TCGTTAAAGA TATTGTAAAA 

< 

ATGTTACCGC. ATCCGATTAA TATGGTAAGG 
ATTATAGCTA AAAGTAATAA ACAAGAATAT 
AGAGGGAATA TATTTGGAGG ATATATTCTT 
CGTTACTATC TGAATGGAGA AGAAATCGAA 
GATATGTATA CGTTCGGTCG TTATTTCCCA 
ATGCCAGAGT TTTTAAGAGA TATATTTAAA 
TTATTGGATT TTCATTTGTC ATGAATTTCG 
GGGTATGTGT TGTTATGGCG ACAAAAAACG 
AAATAAAATT AAATACCAAC GAAAACTATA 
ATCTTAATAC TGTATGTGAA GAAGCTAAAT 
GTCGTACAGC GACATTTATG ATTTTAGGTG 
CGGTTAAGAC AGGTTTACCT AATGAACTTG 
CAGTTGAATT AATGAATTTG AAACACGTTG 
GAGATGCTGG TTCAAATGTT TATGCTGAGA 
TTACAACGAT TGAAATTTTA CCATCAGATA 
TAATGGCGTC AAGACCTGAC ATTTTAAACC 
CGAGAGTTCG TGC?GCGTGCG ACTTACGACA 
AATTACAACC GGATATCCCA ACTAAATCAA 
AAGAAATTTA TGAAACGATG GATGATTTAC 
GTCAATATTT ACAACCTTCA CGTAAACATT 
AGTTTGGTAA ATTAAGAAAA GTGGCAATGG 
CTTTAGTACG TAGTTCTTAT CATGCGGATG 
AACGCCAAGG TGAGGCACAG TTAAATAGTT 
TTAGTTTGTA CAAAACGAAC GTGTCATAGA 
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AGGTGAAGAA 


TTTGATAAAA 


GTAGATCAAC ATTACTTTGA ATTAATAGAA AATTATCGCG 


AATGTTTTAA 


TGAAGAACAA 


TTTATTGCTA GGTATTCAGA 


TATTTTAGAT AAATATGATT 


ACATAGTTGG 


TGACTATGGT 


TACGATCAAT TACGATTAAA AGGTTTTTAC AAAGATTCTA 


ATAAAAAAGC 


AGAGATGAGT 


AAACGTTTTT CAAATATTCA AGATTACATA TTTGAATATT 


GTAACTTTGG 


TTGXCCTTAC 


TTTG^Al iAA CiAUAXliv^iw 


TAAACAAGAG 


GTTAAAAAGT 


TAATCGAAGA 


AGTTCATCCG 


TCTGATGTGA TAGATGACGA 


CAATAAACTT 


CAAGATGTGA 


AGATTAAGCC 


AACCATTCAA 


GATACTGAAC ATTAATAAAA 


CCCTTAGCTA GATTGAAAAT 


GGGAATCATG 


CAATTCAAGC 


AT6GACCTGT AATCTAGTTA 


GGGGTTTTTA TCriTAATGA 


ATGACTTCAT 


TTAAATACTC 


AGTAATTTCA TCGCCTTCTT 


CAGCATTTAC ACCTAAAATA 


TGAGCGATAT 


AGCCTTCTTC 


TTTTAAATCA TCAGTACCGA 


TAATACCGAA 


TTTATTTGTT 


TGCATATTAA 


GTACGAGTGT 


CTTACCATAA TGTCTATiTG 


TATGGACTAA 


CATCAAATCA 


TATCG ACT AT 


GCTCGCCAAC 


AAAACuAaUA i vaAAL. 1 1 


GACTCTCTTC 


GTTGTCATCA 


TATAAATACA 


TATCAATCAT 


TTTGTAGCGA CTCCTTTTAA 


AAGTAGTAAA 


GTTAGTATAA 


CGACAAATGA 


AGTATACTGC 


AAAATTATGA TAATATATAA 


GTGAGAGGTG 


ACAAGGAATG 


TATTTTGTAG 


ACAAAGATAA 


ACTAACTCAG AAATTAGCCT 


ATTTACAAGC 


ATTAACTGAT 


GATTATCATG 


AGAGCAAGCA 


CAATCATTAT GCATTTGAAC 


GCATTGCTCA 


AATGTTGATA 


GAATCATCGG 


TAGATATAGG 


GAATATGATT ATCGATGCAT 


TTATTTTAAG 


GGATCCTGGT 


AATTATAAAG 


ATGTGATTGA 


TATATTAGAA CTAGAAAATG 


TTATTACTAA AGAAACACAG 


CAGGCGATTA 


ATAAAACTGT 


CGGTATTCGT AAACAATTTA 


CATATGATTA 


CACAGCCTTA 


GATGTTGAGA 


TTATCATGCC 


AATGTTTGA 







(2) INFORMATION FOR SEQ ID NO: 215: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 644 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 215: 
ACCGCCACCC ATTAATGATT GCTTAAAATC AATAGTCGTA CCATTTAATA CGGGTGCATC 
- TTTTrrGTCT ACTAATACTT TTAATCCAAA GTATTCTAAG ACTTCATCAT TTTCACCAGG 
CGCTTCTTCT GCACCCATAC CGTATGTTAA ACCAGXGCAC CCGCCACCAT TCACTTTAAT 
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TGCTTCTGTT AATATAACTG TTGGCATGAT AACTCCTCCT TAAAAAATCC AAGTTTCTTT 
TATATGTGCA TATATATTTT GTAATAATTC TTCCGGCGAA TCACCTTCAA CAATATCACC 
ATTTACTAAA GCATACAftCC CGGCTGAACA TATACCACAA TGTGTCAGGC AACCATACTC 
TAACACATCG ACATCTGGGT CATTTTCCAG TTGATTAAAA ACATAATCTC CACCTTTTGC 
CATGTTAGAG AGACAAAATT CTACGATCGG ATTCATACTT CACCTTCTTA TTTCATTTGT 
TACAATATTA TAGCATTTTA AAACTGGTAT TTTAACATGA TGTGCTCAAT TAGCAACAAC 
TGATGTTTCT TATCCCAGTT ATGTAATAGT GCCTTAGTTA GTAC 
(2) INFORMATION FOR SEQ ID NO: 216: 

■ ■ * 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1578 base pairs 

(B) TYPE: nucleic acid 
CO STRANDEDNESS : double 
(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION; SEQ ID NO: 216: 
GAATGATQAA AGGAATAGAA AAGAAAAGAT AAATAATGTA ATAGATTTAT CCGAGAAAAT 

* 

TGAAAGAACA AAAGATATGC CAATCAAGAA TACTATAACT ACTCAATTAG GAAATAAACT 
TATTGGCACA AAAAAAGCTC GTTTTGATGA TAAGAAAGTA GTGTCGTTTG GAGCATTTGA 
AGATGAATAA AATAAATGAT AGAGATTTAA CAGAATTGAG TAGCTATAGG GTTTATCAAG 
ACATCAATAA AGATAATGAC TTTACAGTTA ACGAAAAACG ATTTAAGCAG GCAGATGTAT 
TTGAAGATTT ATATAGAGAG AAACTAAAAG ACACAAATAA ATTAAGAGAG TATAATTATT 
TACAAAATGA AACTTTTAAA AGCGCATAAA TAGGTGATGA GATATGCTTA AAAAAGCAAA 

atttstctta atggcaacga tactactatc aggatgttca actaccaata acgaatccaa 
caaAisaaaca aaatctgtac cagaagaaat ggatgcttca aaatatgtag gacaaggatt 
ccaaccacct gcagaaaaag atgcgattga atttgcaaag aagcataaag ataaaattgc 
taagcgaggc gaacaatttt ttatggataa cttcggtcta aaagttaaag ctacaaatgt 

TATAGGTAGT GGCGATGGTG TAGAAGTATT CGTGCATTGT GATGACCACG AyATCGTATT 
TAATGCGAGT ATTCCATTTG ATAAATCAAT wATTGAsAGT GATAGCTCAT TAAGAAGTrA 
GGAyAAAGGy GATGATATGA GTACTTTAGT TGGTGCAGTA CTCAGTGGGT TTGAATATCG 
AGCACAAAAA GAAAAATATG ATAAATTATA TAAATTTTTC AAAGATAATG AAGAGAAATA 
TCAATATACA GGATTTACAA AAGAAGCAAT TAATAAGACG CAAAATAGTG GTTATGAAAA 
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ACCATTGTTA AACAAAAGTG ACAGTGAATT TTCAAAAGAA TTGTCAAATG TTAAGAAGCA 
ATTAAAAGAT AAGTCTAAAG TTTCGGTAAC TACTACTCTA TTTAGTAAAA AAAAGAACTA 
TACTAAAAAA AGTAACAGTG AAAATGTAAT AAAAATGGCA GAAGAAATAA AAAAAGATAA 
AGAGATACCA AACGGTATAG AGCTTAGTAT AAAATTTTCG GACAATAAAA TAAATACGGT 
TAAACCAAAT TTTAACGGTG aAAGCACTTC AGAATATGGT GTGTTTGATC AAGAATAAAA 
TTAATGATGa AAATTTAACG GAGAATAGTG TATATTGAGT AGATCmAGAA TAAAAAGATA 
ATTCTACTAT TGTTGTGAAG GCAAATAAGT AGAAGATTTT AAGTGTAATT TCTGGTGATT 
TAAATAATAA TATAnATGGtl AGTACTGATA TAAnACTTTT TAACCTACTA GATTCTTATA 
ATTTGCTTTC CATTTTATGA CGATTTTTAC TCCAATTGAG TGATAGAATC CAAAAAAGCC 
ATCTCCAAAA ATTAATCC 

(2) INFORMATION FOR SEQ ID NO: 217: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 5137 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNBSS : double 

(D) TOPOLOGY: linear 



1030 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1578 
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40 



45 



SO 



Cxi) SEQUENCE DESCRIPTION: SEQ ID NO: 217: 
TCTTTTCCTT GGGTTAAAAC ATGCTTGCTA TGCGTTTGTA AATATGACTT GCTGTTTTnA 
CCTGnATACC CGTCACACCA TGGAAGTAAA AATGTTTCTT GCTCTTGGCT TACAATTTTA 
GCTTTAATCG CTTCATATGC TTTATATTGG TCTTCTGTTA ATTGCTGTTT TGATTCTTGT 
TCGAAAACAC GATCTTTAAA TGGGTCTCTT TCAACAACCG CGTCATATTT TTCAACATAA 
CCrmTTGA TAAGTCCATC TAAACTGGAT TTTGAAAAGC CCATATCCTC AATATCAGTT 
AAAAATATTG TTTTATGTTG TTCTTCAGAC AAGTAAGCAT ACAAATCGTA TTGTTTAATA 
ACTTTCTCCA ACTTAGCTAA TACTTCATCA GGATGATACC CTTCAATGAC ACGAACAGCA 
CGCTTGGTTT TTTTAGTTAT ATTTTGTGTG AGAATCGTTT TTTCTTCAAC GATATCATCT 
TTTAACAACT TCATAAGCAA TTGAATATCA TTATTTTTTT GCGCATCTTT ATAATAATAG 
TAACCATGCr TATCAAATTT TTGTAATAAA GCTGAAGGTA GCTCTATGTC ATCTTTCATC 
TTAAATGCTT TTTTATACTT CGCTTTAATA GCACTCGGAA GCATCACTTC TAGCATAGAA 
ATACGTTTAA TGACATGAGT TGAACCCATC CACTCACTTA AAGCTATTAA TTCTGATGTT 
AATTCTGGTT GTATATCTTT CACTTCTATG ATTTTTTTTA ACTTCGAAAC GTCAAGTTGT 



60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
730 
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ACAATTACAC GCACACCAGG TTGGATGACA GATTCGAGTT GTTCGGGAAT TATATAATCA 900 

AATTTATAGT CAACGCTCTT CGACGCGACA TCGACTATGA CTTTCXSCTAT CATTATTGCC 960 

ACCTAGTTTC TAGTTCATCT AAAATTTGTG CAGCTAATAC TACTTTTTTT CCTTTCTTGA 1020 

TATTTACTTT TTCATTATTT TTAAAATGCA TTGTCAATTC ATTATCATCA GAACTAAATC 1080 

- • - • . 

CXJATAGACAT ATCCCCAACA TTATTTGAAA TAATCACATC TGCATTTTTC TTGCGTAATT 1140 

TTTGTTGTGC ATAATTTTCA ATATCTTCAG TCTCTGCTGC AAAGCCTATT AAATACTGTG 1200 

ATGTTTTATG TTCACCTAAA TATTTAAGAA TGTCTTTAGT ACGTTTAAAA GATACTGACA 1260 

»5 AATCACCATC CTGCTTTTTC ATCTTATGTT CTAATACATC AACCGGTGTA TAGTCAGATA 1320 

CXX3CTGCTGC TTTTACAACA ATATCTTGTT CGTCAAATCG GCTTGTCACT TGTTCAAACA 1380 

TTTCTTCAGC ACTTTGAACA TGAATAACTT CAATATCTTT TGGATCCTCT AGTGTT6TAG 1440 

GACCAGCAAC TAACGTCACG ATAGCTCCTC GATTTCGCAA TGCTTCAGCT ATTGCATAGC 1500 

CCATTTTTCC AGAAGAACGA TTGGATACAA ATCTGACTGG ATCGATAACT TCAATAGTTG 1560 

GTCCTGCTGT AACCAATGCG CGTTTATCTT GAAATGAACT ATTAGCTAAA CGATTACTAT 1620 

TTTGAAAATG AGCATCAATT ACAGAAACGA TTTGAAGCGG TTCTTCCATA CGTCCTTTAG 1680 

CAACATAACC ACATGCTAGA AATCCGCTTC CTGGTTCGAT AAAATGATAC CCATCTTCTT 1740 

30 TTAAAATATT AATATTTTGC T6CGTA0GTT TATTTTCATA CATATGCACA TTCATAGCAG 1800 

GCGCAATAAA TTTCGGTGTC TCTGTTGCTA GCAACGTTGA TGTCACCAAA TCATCAGCAA 1860 

TACCTACACT CAATTTTGCA ATTGTATTTG CCGTTGCAGG TGCAACAATG ATTGCATCTG 1920 

CCCAATCACC TAATGCAATA TGCTGTATTT CTGAAGGATT TTCTTCTATA AAAGTATCIG 1980 

TATAAACAGC ATTTOGACTT ATTGCTTGAA ATGCTAATGG TGTCACAAAT TTTTC3TGCGT 2040 

GATTeGTTAA CATAACGCXSA ACTTCATACC CAGATTGTGT TAACTTACTT GTCAAATCAA 2100 

TTGCTTTATA TGCCGCAATG CCACCTGTAA CGGCTAATAA TATTTTCTTC ATATTCAATC 2 ISO 

TCCCTTAAAT ATCACTATGA CATTTACGCT TTACATCATC ATATGCGCAC AAATGCTCAT 2220 

TACTTTTTTA TAGATACAAA TTTAGTATTA TTATAACATC AATCATTGGA TAAACTAAAA 2280 

AAACACACCT ACATAGGTGC GTTTGATTTG GATATGCCTT GACGTATTTG ATGTACGTCT 2340 

AGCTTCACAT ATTTTTAATG GTCGAAACTA TTCTTTACCA TAATAATCAC TTGAAATAAC 2400 

SO AGGGCGAATT TTACCGTCAG CAATTTCTTC TAACGCTCTA CCAACTGGTT TAAATGAATG 2460 

ATATTCACTT AATAATTCAG TTTCAGGTTG TTCATCAATT TCACXJCGCTC TTTTCGCTGC 2520 

AGTTGTTGCA ATTAAATACT TTGATTTAAT TTGTGaCGTT aATTGGTTtA AAgGTGGATT 2580 
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TTTArGTGcT CAGCTTCTAC AATACATTGA ATTCtATTCy TCGcAAGtTC TACTTCAtCA 
TTAACTACAA cGTAAyCGTA TAAATTCATC ATTTCrACTT CTkTACGCGC yTCGTTAATA 
CGACTTTGTA TTTTCTCATC AGATTCTGTT CCTCTACCTA CTAATCGCTC TCTCAAGTGT 
TCTAAACTTG GAGGTGCTAA GAAAATAAAT AGCGCATCTG GAAATTTCTT TCTAACTTGC 
TTTGCACCTT CTACTTCAAT TTCTAAAAAT ACATCATGAC CTtCGTCCAT TGTATCTTTA 
ACATATTGAA CTGGTGTACC ATAATAGTTG CCTACATATT CAGCATATTC TATAAATTGG 
TCATCTTTGA TTAAAGCTTC AAACGCATCC CTAGTTTTAA AAAAGTAATC TACGCCATCA 
ACTTCACCTT CACGCATTTG ACGTGTTGTC ATTGAAATAG AATACTTATA TGATGTACTT 
GGATCTTCAA ATATnCGTnT TCTAACAGTA CCTTTACCTA CTCCAGATGG TCCTGATAAA 
ACGATTAACA ATCCTTTTTC ATTATCCATG CCTTACGACC TCTCTAAGCT AATCTTCTAT 
TATTTAAATA TGATATCACA TTGTTCTTTA TATTGTATAG CATATTTGAA ATTGCATGCC 
ATAATTTCTA TTAAGTCTAA CAATATCGTT ATATTGCACX5 ATTAATTTTA ATTAAATAAA 
TTGAATTGCA AACTTTTAGA TAATGTAAAA TGTATGGCAT AATGTATGGT TCAATAACTA 
TACTOAAAAG TTACAATCAT GTTAAAATGA AACGAATGAT ATGAAGAAGG TGGAAGATAA 
ATTATGGCTT ATGATGGCTT ATTTACAAAG AAAATGGTTG AGTCTCTACA ATTTTTAACA 
ACAGGACGTG TTCACAAAAT CAATCAACCT GATAATGACA CGATACTAAT GGTTGTACGT 
CAAAATAGAC AAAACCATCA ATTGTTATTG TCAATCCATC CAAACTTTTC AAGATTACAA 
TTGACTACTA AAAAATATGA TAATCCATTT AATCCACCCA TGTTTGCGCG TGTTTTTAGA 
AAACACTTAG AAGGTGGTAT TATCGAATCG ATTAAGCAAA TTGGTAATGA TCGTCGCATT 
GAAATCGATA TAAAGAGTAA AGATGAAATT GGCGATACTA TTTACCGCAC TGTCATCCTT 
GAGATTATGG GTAAACATAG TAACTTAAtT TTAGTAGATG AAAATCGCAA AATAATTGAA 
GGATTTAAAC ACTTAACACC AAATACGAAT CACTATCGTA CAGTAATGCC AGGATTTAAT 
TATGAAGCAC CACCTACTCA GCACAAAATA AATCCGTATG ATATTACAGG TGCAGAGGTG 
TTGAAATATA TCGATTTTAA CGCAGGTAAT ATTGCTAAAC AATTATTGAA TCAGTTTGAA 
GGATTTAGCC CTTTAATTAC GAATGAAATC GTTAGTCGTC GTCAATTTAT GACTTCATCA 
ACATTACCAG AAGCATTTGA CGAAGTAATG GCAGAAACCA AGTTACCACC TACTCCTATT 
TTTCATAAAA ATCATGAAAC AGGTAAAGAG GATTTCTATT TTATAAAGTT AAATCAATTT 
AATGATGATA CAGTTACATA CGATTCATTA AATGATTTGC TTGATCGTTT TTATGATGCG 
CGTGGCGAAC GTGAACGCGT TAAACAACGT GCGAATGATT TAGTTCGATT TGTTCAACAG 
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ATAAAGATAC TGAACAGTTA TATGGTGAAT TGATCACTGC TAATATATAT CGAATTAAGC 
AAGGCGATAA AGAAGTGACG GCATTGAATT ATTATACGAA TGAAGAAGTT GTCATTCCTT 
TAAATCCTAC AAAATCCCCA TCAGCAAATG CTCAATATTA TTATAAACAA TATAAyCGTA 
TGAAAACGAG AGAmCGTGAA TTACAACATC AAATTCAATT GACGAAAGAC AATATAGATT 
ATTTTTCAAC AATCGAACAA CAATTACATC ATATTTCTGT CCATGACATT GATGAAATTA 
GAGATGAATT AGCAGAACAA GGCTTTATGA AACAGCGTAA AAATCAAACT AAGAAAAAGA 
AAGCGCAGAT TCAATTACAA CATTATGTAT CAACTGATGG CGACGATATA TATGTTGGTA 
AGAATAACAA GCAAAATGAT TATTTAACAA ATAAAAAAGC .TAAAAAAACT CACACATGGT 
tACACACAAA AGATATTCCT GGTTCACATG TCGTTATATT TAATGATGCA CCAAGTGATA 
CGACAATCAA GGAAGCGGCT ATGTTAGCAG GATACTTTTC AAAAGCTGGT AATTCTGGAC 
AAATACCTGT TGATTATACA TTAATTAAAA ATGTGCATAA ACCATCaGGT GCAAAGCCTG 
GGTTTGTAAC ATATGACAAT CAAAAAACTT TGTATGC 
(2) INFORMATION FOR SEQ XD NO: 218: 

. (t) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 22^7 base pairs 

(B) TYPE: nucleic acid 

(C) 5TRANDEDNES5 : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 218: 
GTTTTATCGC AGCAGTAAAG CTATCAATCG GCGGTTCAAT TGATGATGCA TTAGCAGAAA 
TCAnACAATC ATTTTAGTTA AAATTTACTA ATAATGAaAA ATGTAAACCT TTTTCAAATG 
AAACTTTATa AaAAATATGA TAGTATATAT GTAAATGTTT AATAAAATCT GGAGAAATAG 
GAGGACATTG CCATGCAACA CCTTATAAAA AAACATGTAT TGAATGGCGA GTTTGATTTA 
GTACGACAAT TGATGTCCGA AACAGATTTT ATGGAATTTG AAGAAGCATA TATTTCAAGT 
GCGCATGAAG TAGAAAGTAT GATGTTTTAT ACATGTATTT TAGATATGAT TAAGTACGAA 
GAATCATCTG AAATGCATGA "CTTAGCATTT TTATTGCTTG TGTATCCACT AAGTGAATAT 
GAAGGTGCTT TGGATTCTGC TTATTATCAT GCAGACGCTT CCATAAAACT TACTGACGGC 
AAAGAAGTTA AAAGTTTGTT ACAAATGTTA TTATTGCATG CGATACCAAC ACCTGTTATT 
TCAGATAAGA AGGCTTTTGA TATCGCCAAG CAAATTTTAA AATTAGATCC TAATAATAAT 
GTTGCTCGTA ACGTCTTAAA AGACACTGCC AAACGTATGc gACAaCGTTG TTGTTGATAT 
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AGTTTTAACA TTTGGTTGGG TTGGGCATAT GTTCCAGCCT TTTTT A ATAC TTAAAAACTA 780 

ACGAAgTAT A CTTGTGTGCA . CAAATGGTTT TTATACAACA TTTTATAAAT .TTATACATTT . 840 

5 

TAATAAAGAA CATACGATAG ATGGTTTAAA CCTTGTTAAC TGAGAAATTT TGATATGTAT 900 

TCTTCGAAAT TTAACTAAAT ATACGAAATT CAAGAAGCAC AATAATTAAT CATTTTTCCT 960 

ATACAAAAGT TCGTATGACT GCATTATAAA AGCATAAATT TATAATTTTT TTAAATGTCA 1020 

TTGAACGTGA TAATGTGAAT GGATTGAGCA ATTTTGAAAA AGTGAAAAAT AACCTATGCG 1080 

ACTTGCAATT AATTTTCAGT ACGTTATAAT GCACACTGTG CAAAATTAAG GAGGTCTATT 1140 

T5 ATTCACATGA TGATGAaTAA AGAAGCAACA AAAATTGGAT TTGCCTACGT CGGCATTGTA 1200 

GTGGGCGCAG gATTTTCAAC TGGACAAGAA GTTATGCAAT TTTTCACTAA ATATGGCTTG 1260 

TGGGCTTATT TAGGTGTTAT TATATCTGGT TTTATTTTAG CTTTTATTGG GCGCCAAGTA 1320 

20 

GCAAAAATTG GTACTGCCTT TGAAGCGACA AATCATGAAT CAACATTACA ATACGTATTC 1380 

GGTGAAAAGT TTAGTAAAGT CTTTGaTTAT ATTTTAATCT TCTTCTTATT TGGTATAGCT 1440. 

GTAACCATGC tAGCTGGTGC AGGCGCAACA TTTGAAGAAA GTTATAACAT ACCTACATGG 1500 

25 

CTAGQTGCTT TaATTATGaC ATTAGCGATT TATATTACGT TGCkATTAGA CTTTAATAAA 1560 

ATAGTACGTG CACTAGGTAT CGTTACACCA TTTTTAATTG TTTTAGTTGT ATTAATCGCT 1620 

*' ■ 

GGCGTTTATT tATTTAAAGG TCATGtTTCA TTAGCAGAAG TTAACCAAGT AGTGCCtGAA 1680 . 

* • * " 

GCAAGTATTT GGAAGGGAAT CTGGTTTGGT ACAATATATG GTGGATTAGC TTTTTCTGTA 1740 

GGTTTTAGTA CCATCGTAGC AATCnGTGGG GATACTGAAA AGCGTACAGT GTCAGGTGCA 1800 

35 GGCGCGATGT ATGGTGGTAT TATCTATACT GTATTACTAG CATTGATCAA CriTTGcATTG 1860 

CAAGTGaATA TCCAACTATT AAAAATGCCT CAATTCCTAC ATTGACGTTA GCAAATAATA 1920. 

TCCMCCTTT AATAGCAACA GTGkTATCTG TTATTATGCT GGCGGkTATG TATAATACTA 1980 

40 V 

TTCTAGGACT AATGTATTCA TTTGCAGCAC GTTTTACAGA ACCATACAGT AAAAATTATC 2040 

ATATCTTTAT TATTATAATG ATGGTAGCAG GTTATTTATT AAGTTnCGTA GGATTTGCTG 2100 

AATTAATTAA TAAGTTATAT ACnATTTATG GGATATGTAG GCTTATTnTA TTGTAGTAGC 2160 

45 

» ■ . * 

TGTAATTATn AAATATTTCC AAAOGTAAAA ATGGCGGATA AAAAACATAT TGCTTTAATA 2220 

TCATATGGAG GGGATATCCG AAACTTTACA ATTTGAATCA CTTTGGT 2267 
SO (2) INFORMATION FOR SEQ ID NO: 219: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 6336 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
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(Xi) SEQUBKCB DESCRIPTION: SBQ 10 NO: 219: 
GTCAATGTAA CCTAATAGTT TATGTCTATC OTGTGTACCA ACTACTACAT CX5ACACCAGG 
AATTTCCATA ATTTCAGCTG ATGAAGTTTG CGCATAACAA CCTGTTACAC AGATTACAGC 
AXCAGGATTT TGTCTTATTG CACGTCTAAT TATTTGACGA CTTTTTTTAT CACCCGTATT 
CGTTACTGTA CAAGTATTAA TAACAAATAC ATCAGCATTC GCTTCAAAGT CAACGCGCTC . 
ATAGTTTGCT TCTTTAAATA ATTGCCAGAT TGCTTCAGTT TCATAATGGT TTACTTTACA 
ACCTAATGTG TGaACGCAAC TGTTGACATA AATATTCACC CCATTAATTC TTTTTCATAA 
CTTATTGCAC TTAACGCATA CAATGGCGCA GTTTCTGCCC GTAAAATTCT CGGCCCAAGA 
CCAACAACTG TACTAGTATT ACTAAATAAT GAAATTTCAT TTTCTGACAA ACCACCCTCA 
GGaCCAAAAA TCATCAACAC TTTATCCTGA GCATTGAATT GTTGTAAAGT TTGCTTGAAA 
TTGCTTAACT CACCATCTTT TGCTTCCTCT TCATATGCAA TAAGAATATA GTCATAATTA 
TCAATAGTAT CACAAATTAA TTTTAAATTC GACTCGAATT GAATAGATGG AATCACTAAA 
CGATAGCTTT GTTCAGCAGC TTCTTTAATT ATTTTTTGCC AACGCTCTAT CTTTTTGGCA 
ACTTTTGCCT CGTTTAATTT AACAATTGAA CGTTCCATGC TCACAGCTAT AAATGATGAA 
GCACCCAATT CAGTAGCTTT TTGTAGCAAC CACTCATATT TGTCAGCTTT GATTAGTCCA 
CTGCAAATCG TAACATCAAC TGGCAATTCT GTATTAATAT TTTGTTTTTC TTTTAAATCA 
ACTTCAATTT TATCACTTGT TATGTCAGCA ATTTCACATA AATAAACTGT TTGATCATTA 
AAAGTTAAAA TAATTTTACT ACCAACATCA TATCTCATTA CATTTGTTAT ATGATGAATA 

TCTTCTrrrr ttgtaataaa aaaacgctga cttacatcag cxTrrrrGGnT ctatgaaata 

ACGCTGCACA TTATTCACTC ACTTTCTGGC CAACAAGACA AACCCAACCG TTGTCATGTT 
GTTCTGAAAT AATTTTAAAA CCTACACGCT CCATATGTGA CTGTATACCT TCATACTTCT 
CTTTTATAAT ACCAGAAGTA ATAAAATAAC CGCCTTCATT TAGAGTATTA TAAGCATCTT 
CAATCATTTC ATCAATAATA TGCGCTAAAA TATTTGCTAT TACAATATCA AATTTTTCTG 
TTTCGTCTTT CAATAAGTTA CCTGGAACAG CTTCAATTAA CGTTTCACAA TGATTTCTTC 
TGAAGTTTTC TTTAGCTACA CTCACTGCCA TTTCATCAAT ATCCAACGCT TTAATACGTT 
TTACACCGAT TAGATGACTT GCAATACTTA ATATACCTGA GCCAGTACCA ACATCAATTA 
CTGAATGCTG TGGCAATACA TATGTTTCTA TTGCCTTCAA ACACATACTT GTAGTCGGAT 
GATCACCTGT TCCAAAAGCC ATACCTGGGT CGAGCTCAAT GCAAAGCTCT TCATCCGCTT 
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GGAAATAGTT TTTCCATTCA TTTTCCCAAT CCGTCTCTGC AATAATTTGC TCACTGAATT ' 1740 

GAACGTTATG TTGATCAAGT TCATCTAAAT TTAATAACTC ATCTTTAATT TGCTGTCGCA 1800 

ACTTATCATC ATAAGTCATT TCATTAAAAT AGGCTTTCAA TCTTACTCCC TTATCTOGAT I860 

AATCCTCTTT TTTCAAAGCG TAAATTTCAC CGTATTTATC TTCTGGTTGG TTAATTAAAT 1920 

CATCTGAATC TTCTATCACG ACACCATTTG ATCCATGATT TTCAAGTATA TTGGTAGCCA 1980 

ATTCTACTGC TTCATGATTA ATAATAATTG AAAGCTCTCT CCAGTTCATA CTTTATTCTC "•2040 

CCTTAAAGAA TCTTTTTGCT CTATCTTTAA AATTCGAAGG TTGTTCATTA ATTTCTTCAC 2100 

CATTTAATTG GGCAAATTCT TTCATTAGTT CTTTTTGTCT ATCTGTTAAT TTAGTAGGCG 2160 

ITACTACTTT AATATCAACA TATAAATCTC CGTATCCATA GCCATGAACA TTTTTTATAC 2220 

CCTTTTCTTT TAAGCGGAAT TGCTTACCTG TTTGTGTACC AGCAGGGATT GTTAACATAA ' 2280 

CTTCATTATT TAATGTTGGT ATTTTTATTT CATCX3CCTAA AGCTGCTTGT GGGAAGCTAA 2340 

CATTTAATTT GTAATAAATA TCATCACCAT CACGTTTAAA TGTTTCAGAT GGTTTAACTC 2400 

TAAATACTAC GTATAAATCA CCAGCAGGTC CTCCATTCAC GCCTGGAGAG CCTTCACCAG 2460 

CTAATCTAAT TTGTTGTTCA TTGTCGACAC CTTCAGGTAC TTTCACTTCT AATTTAACTG . 2520 

■ 

TTTTATTTTC AGTACCTTTT CCGTGACATG TTGGACAAGC TTCTTCAAAT TCTTGACCAC 2580 

TTCCATTACA TTTAGGACAA ACTTGTTCAG TACX5AACTCT ACCTAAAATT GTGTTTTGTT 2640 

CTACAGCTAC ATGACCAGCG CCATTACAGT AACTACAAGT CTTTTTACTT GTTCCAGGCT 2700 

TTGCACCATC ACCATGACAT GTTTCGCATG TTACATCTTT ACGGATTGAA ATTTCTTTTG 2760 

TTGTACCAAA TACCGCTTCT TCAAATGTTA . ATGTCATTGT ATACTGAAGA TCATCACCTT 2820 

TTTGCGGTGC ATTTGGATCT CTTTGTCTGC CGCCACCGAA GAAAGAGCTA AAGATATCTT 2880 

CAAA5CCGCC GCCACCGAAG CCACTAAAAC CGCCAAAGTC AGAGCCATTG AATCCTTGTC 2940 

CACCAAAACC TTGTGGACCA TCATGTCCAA ATTGATCATA GcTTGCGCGT TTATTATCAT 3000 

CACTTAAAAC TTCATAGGCT TCAGAAATTT CTTTAAACTT TTCATCTGCA CCTTCTTCTT 3060 

TGTTAATATC TGGATGATAT TTTTTCGAAA GCTTTCGATA CGCTTTTTTG ATTTCATCTT 3120 

TTGAAGCATC CTTACTAATG CCTAAAACTT CATAATAATC TCTTTTGGCC ACAGCTATCT 3180 

CTCCTTTTCT TAATTAACTC ATATAGTTTA ACGTAATATG TCATACTATC CAAATAAAAA 3240 

GCCAAAGCCA ATGTTCTATT GACTTTGACT TTTCAGATCA TGACAACATT CTAATTGTAT 3300 

TGTTTAATTA TTTTTTGTCG TCGTCTTTTA CTTCTTTAAA TTCAGCATCT TCTACAGTAC 3360 

TATCATTGTT TTGACCAGCA TTAGCACCTT GTGCTTGTTG TTGCTGTTGA GCCGCTTGCT 3420 
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TATCTTCTAT ATCTTGACCT TCTAAAGCAG TTTTAAGAGC GTCTTTTTTC TCTTCAGCAG 
ATTTTTTATC TTCTTCACCG ATATTTTCGC CTAAATCAGT TAAAGTTTrT TCAACTTGGA 
ATACTAGACT GTCAGCTTCG TTTCTTAAGT CTACTTCTTC ACGACGTTTT TTATCTGCTT 
CAGCGTTAAC TTCAGCATCT TTTACCATAC GGTCGATTTC TTCGTCTGAT AATGAAGAAC 
TTGATTGAAT TGTAATTCTT TGTTCTTTAT TTGTACCTAA GTCTTTTGCA GTTACATTTA 
CAATACCGTT TTTATCGATA TCAAACGTTA CTTCAATTTG AGGTTTACCA CGTTCAGCTG 
GTGGAATATC AGTCAATTGG AATCTACCAA GTGTTTTATT ATCCGCAGCC ATTGGACGTT 
CACCTTGTAA TACGTGTACA TCTACTGATG GTTGATTATC TACTGCTGTT GAATAGATTT 
GAGATTTAGA TGTAGGAATC GTAGTGTTAC GTTCAATTAA CGTATTCATA CGTCCACCTA 
AAATTTCAAT ACCTAAAGAT AGTGGTGTTA CGTCTAATAA TACTACGTCT TTAACXTTCAC 
CTGTGATAAC GCCACCTTGG ATTGCAGCTC CCATTGCCAC TACTTCGTCC GGGTTTACTC 
CTTTGTTAGG CTCTTTACCG ATTTCTTTTT TGACAGCTTC TTGTACTGCT GGAATACX5AG 
TTGATCCACC AACTAAGATA ACTTCATCGA TATCTGAGTT TGTTAAGCCA GCGTCTTTCA 
TTGCTTGGCG TGTAGGTTCC ATTGTTCTTC TAATTAATGA ATCTGATAAT TCTTCAAATT 
TAGAACGAGT TAAGTTTACT TCTAAGTGTA ATGGACCGTT TTCACCAGCT GAGATAAATG 
GTAATGAGAT TTGAGTTTGT GATACACCTG ATAAGTCTTT TTTAGCTTTT TCAGCAGCAT 
CTTTCAAACG TTGTAATGCC ATTTTATCTT GAGATAAGTC TACGCCATTT TCTTTTTTGA 
ATTCTGCAAC TAGGTAGTCA ATAATTACTT GGTCAAAATC ATCACCGCCA AGTTTGTTGT 
CACCGGCTGT TGATAGTACT TCGAATACAC CGTCACCTAA TTCTAGGATA GATACGTCAA 
ATGTACCX3CC ACCTAAGTCA AAAACAAGAA CTTTTTCATC TTTATCAGTT TTGTCTAAAC 
CATATGCTAA TGCTGCAGCT GTTGGTTCAT TAATGATACG CTCAACTTCT AAACCAGCAA 
TTTTACCAGC ATCTTTAGTT GCTTGACGTT CAGCATCGTT AAAGTATGCA GGTACTGTAA 
TTACAGCTTT GTCAACTTTC TCACCTAAaA TAgTTTCAGC TGTATTTTTT AAGTTTTGTA 
AAATa\TAGC TGAGATTTCT TGTGGTGTGT ATGATTTACC TTCAATATCT ACTTTATAAT 
CAGTACCCAT ATGACGTTTA ATAGATTGAA CAGTGTTTGG GTTTGTAATA GCTTGACGTT 
TTGCTACTTC aCCAACTTGA GTTTCTCCAT TTTTGAAAGC TACAACAGAT GGTGTTGTAC 
GTGAACCTTC AGGGTTTTGA ATTACTTTTG GCTCATCGCC TTCTAATAcT GTnACACATG 
AATTTGTTGT ACCTAAGTCT ATACCAATAA TTTTACTCAT AATAAAATTC CTCCATTTAA 
TCATTAAATT AATTTAATTT TAAACAATGT CTTTTCGCCA AATTTAAGTT ATTGGTTTAC 
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AGTGATTTCG CCAGATTCAA AATCAGGGTT ATCATCTTGA ACTACAGCTT GGTGAATATT 5340 

TGGATCAAAT GCTTCACCTT CAGTTTTAAT AACTTCAAGA CCATTATCTT TTAGTGCGTT 5400 

AATCAAACTT TCATGCACCA TTTGTACACC TTTTTGAAGA GATTTAAAAG TCTCATCATC 5460 

ACCTTCAATT TGAAGTGCAC GTTCTATATT GTCTATTGCT GGTAAAATAT CTGTTAACAC 5520 

ACGTTGTGCT TGATATGTTT TGTTTATTTC ATTTTCTITT TGAATTCTAC GCTTATAATT 5580 

TTCAAACTCA GCGTAGAGCC TTAAATATTT CTCTTCGTTT TCATCTGCTA ATTGTTGAAG 5640 

TTCATTAATT TTTTGATCTT TTGGATCTAT TTCTTCAATA ACATTCTCGT CAGACGTTTC 5700 

75 TTCTATTGCT TCATCTTGTA AATGACCTTT ACTTTCTTCA GCTTGTTCAA CTGAATCATC 5760 

AATATTTTGT TTGACGTTTG TTTCTTCAAC TGTTGATTCA GTGTTTTTTT CAACTGATTC* 5820 

GTCTTTATTT GTCATTTTCT GTCCTCCAAT ACTTTCTAAT CCATCATTAC CAAATTCTAT 5880 

TTAATAATTG AATGACATTT TGATAATGCA TAGCTGTAGG TCCAATCACA GCGATTTGAC 5940 

C TTTT A ACGT TTCATCAAAA TGATATTGAC TTGTTACAAT TGAAATATCA CTTAAGCTGT 6000 

CATCAATTTC ATTACCAATT TTTACATTAA TATTTGGTGA AGATATATCT TGTAATAATT 6060 

CTGCAATTCT ATTTGATTCT ATATATTGTA GAATGGGCTG AATTGAAGAT ACATTACTTT 6120 

CATTCAATGC ATCAATAAGT TTAACCTTTC CACCCATATA AATGCTATTA CTTTGATTAG 6180 

AAATATGATT ATTCATCGTA TTTAACAATT TATTGATAAA AATTTCTTCC TGCTCTGATT 6240 

GAaCAAAAGA GACAATATCA TCTTGTAAAT TCTGATTAAA CTCAGTTAGT XTGTTTGTAA 6300 

CAAAATTTGA TATTGTATTT AGTTTGTCAT TATTAA 6336 

(2) INFORMATION FOR SEQ ID NO: 220: 

(i) SEQUENCE CHARACTERISTICS: 

<A) LENGTH: 13059 base pairs 
(B) TYPE: nucleic acid 
40 \ (C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 220: 

45 

TTCATGATTA TTATCTGTTG TAGACACTGC TGGATCTTCC GATGTATCTT TCGATGCATC 60 
TTTCGATTTG TGTATTTGCT GATTCAAATG GTCTAGGTCT TCTAACGCCT TATTTACCAT 120 
50 TGCTTCATCA TTTTTATCAT CTTTTTCTCC ATGTTTTGTT GTAGCCGTTT GTGACATATC 180 

ATTTTTCATT GCATTAAGAT CGTCCTCGCC ACTTTGTTGA CCCCTATCAA CATTTGAAGA 240 
AACCTCATTT AAATCTTTAA GCAATTGATC TAATTTACTG TCTATATCAC TTTGACCGTT 300 
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TTCATCTATT TGCGATGCTG TTTTCGCTTC ATTTAGTTGT GCTTTATAAT GtTCTTTAGA 
TGAAGCCGAT AACTGTTTTA ATTGCTCAAT TTGACGAATT GCCTTGTCAA CTTTGTCTAA 
TAAATCTTGC TTAGATAATA TCTCTTTTGT AATTTCAGTA TCCTTTTCAG ATGCAGCTTG 
GGCATCGTAC GGCAAGATAT TCGTTAAAAT GATACTTGTC GCCATCATTG TCGAACACGA 
TAACTTTACA TATAATTGAA ACGGTTTCCC TCGATATTTA GCCATCAACA TACTCCTTCC 
TCACTTACTT CCTTCAAAGA ATTACATACT ATTATATACC - TGTTTACAAG AAATTTACAC 
TTATCTATCT AGTTATTGTT GTTAGTAATT ATCTACTTAT TACTTAGCTT ATATTTAAGT 
AAACAAAACA AGCATGACGT AAXATCATAT IGTCCATGTC GCTAACATCA TATTACGTCA 
AATCTTTTAT ATTAAATGAT GTTTTATTTT AGACTGCTTT TTCCTTTTAG CTTTCGAGCG 
CCTGTTTAAA AACTTGCTCG AATTGTTCAC GCGAGATTTC GTGTGCATGT GCTTTTTGTG 
CTAATAAAGC ATCTCGAAAC TGTTGTTGAT CTTTCAAACT TTCTAACATT TGTATTAATT 
GGTCTTTACT TTCCATTGTT ATCTCATCAT TATGCTCAAA TAAGTGCTCT GATAATGTTA 
CTTTAGCATG GTGTGCGGTT TGACGATAAC CTAAAATCAA CAACTCATAG TCAAACGCTT 
GTTCCACCGC ATTTAAAATT TCATTACCCT CATTGATATC AAGATAAATA TCACATAACT 
GGTATAGTTC ATTTACCCTG TCAATATTAA TAGATGGGTA TAAATGCACA TTAGCATATT 
GATCAAGTTG CATTAGCTTA TCAGACATCT CTGTAATAGC AGCGATGTGn AACTTAAAAT 
CTGGTAAAGt TyCAACCAAT ACCTTGATGT TACGAatTGa TCCgAGTTAG TTAATATTAC 
AATTTCTTTA GTATATCTAT TACGACTACG ATAGTTATAT AGATATCCGC CTTGTAAAAT 
ACGAGATTGA ACCTTTGCGT CTGCTATATT GAGCATCGTT TCATATTCGT TTTTATCTGG 
AATAATAATA TTACAATGTC GTTTCATATC ACCTTTACAC ATCAATTGCA TATTTCCCGG 
GACATTACCA TTACAGTGTT CTTGCCATAC CAAAACATCA CTACCTTTTG ATGGCAAATT 
ATATAACACT GAAAATGGTA GGGCTAGTGA GTTAATAACG AAATGATGTT CCGTAATTTC. 
AAGTTGCTTG ATAAAAAATA ATGCGAATGC GAGCTTTGAA GGGAAAAAGT AAGACTTCCC 
TTGCCAATCC AATATGACAT CAGATGTTAC AAAATTTTCA TAAATCACTT CTTTACCTTC 
TGCTGTCATA TATTTCTTCA AGATCGCTTT ACGATTTAAA TCGTAAACAG TTTGTGCAAA 
TTTAATACCA TTCTTAGAAT AATAATCGAC AAATCGGACA CGTTGTTGGT CATCAAACCA 
TTCGACACGA'^ CTAACAATTC TAGGGCGCTC TCCACTTTGA yAAAATATTT TACCTCGyAG 
ACGTCCCATA TCATTaATTG TAGCCGAATT GTTGTTACCT TTAATTTCCC AAAAAGCTGG 
TACAGTAACC TGATTAAAAA ATCGTGGTTT CATATTTTCT GTATTATGAT TATCTGCAAA 
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TAAATCTTCT TCCAACTTAC TGGCTTTAAA AGACTCATAT AACTTTCGTG AATGATCGTT 
AAAGTAATCA AATAATTTAA TCATGTAGCA CCTCTTGaAC TAATGTTTCC CATTTTAAAA 
TAATATCTTG AGTCATAAAT TGCTGTGCCA CTTCATAAGA GATGTCATGT GGTGTCTGGG 
GACCATTGTT AAAATACATT ACAATGGcAT GAGCTAGTTT TGCGATAACA TCATCCACAC 
TATCTTCGTC GGTATCAAAA GGTACCAAGT AGCCATTTTC CCCATCTCGA ATAAAGGTTG 
GGTTACCATA ATTCAGATTT AATCCAATCA TACCTAGTCC TGAGCCTACC GCTTCCATTA 
GTGTTAACCC AAAACCTTCG CTAGTTGATG CAGAAAGAAA TAACTCATAA TCATTATAAA 
TTTCATCAAG TTTAACATGC CCTAGTAAAC GAATATAATC TTGTGCGCGG TGTGTATCAA 
TAATTTTAOG CAGTCGCX5TC TTCTCGCTAC CTTCTCCATA AATATCAAAT GTTAATTCTG 
GCACTTGTOG TTTAGCCACG ATAACCGCTT TGACAAGCCA ATCAATATGT TTCTCATTCG 
CTAAACGAGA TGCACTAATC ATCGCATATG GCTTTCTTGA TAATGTTGGA TATGATAATG 
CATCAATGCT TCCCACAGGA ATAGTATAAA CACGTGGGCG ATAACCTTGA TATTGCTCAA 
ATTGTCGACA AACCATATGA TTTTGAATAX CTGTTGCTGT AATAAAGAAA TCAATGTATT 
TAGCTTTTGA AAATTGATAT TCATAATAAT TGTTCCATAG TATATGCTGC TCACTCATCA 
TATTATTACT ATAATGATCA GCATGAATCA CAACACCAAC TTTACTATCA CCTTTATGCT 
GCAAAACAGC CTGACCAATA TCAGAAGCGC GGTCTAATAT GACAATATCG TCTCGGGTTA 
AATTCAATCG TTGTAAAAAG TATGCAATAA ATTCCGTTTT GTTATACAAC ACCGCATCTT 
CAAACACATA TATAGAGCTG TCTCCATCAA TATATTCGTT ATAAGCGATG GAACCATCTT 
GATTATAAAA TTGTCGCATA TATAATTTCG CTTTATTATC AGCTGGTGCA TAATACTCAG 
AAAATATGCG CGTATAACTA TAAAAATCTT TACGTACTAA CATACTATTA ATTACAAATT 
CTGCACGATC CACAATATCT TTTTGTTCAT TTTGCAGATA ACATGTTACA AATGATGATT 

■ 

TCCCATTAAA ATATAGGCGG ACTATCTTAC CATTTCTTTC TCTAAAACTA ATGTCATGAC 
CAAGCTCACG TTCAATGTCA TCTAACGTGT ACGTTGTTGG TGCTAAAGAA ATATCACTAA 
AATACTGATA CAACCAAATA ACTTCTTGAT CTTTAAACCC AATGTTTTGC GTTAATGTCT 
GTATGTTCTC TGACTGTATA AAATCTAAAA ACACAAATTT AGTGTCTTGA TTTGTACGTC 
TCAATAATTT AGCACGGTAA GCTTGTGCAT ATTCAACACC GCTACTCGCC CAGCCTATAC 
CAAAGTTTAT ATTATATATT GTCATGCGCT ACCCCTTTTC ATTTATGGAA AATGTATAAC 
TGGCATACCC TCTTTATCAA ATGTAATCAT GCTTTGACAA ATATTTTTCA CCATTCTTTT 
TTTGATATTT CGTGTCATAA CTTCAAATGA ATCTAAGGCA ACTCTATGGT ATTCAAAAAT 
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GACTTGTTCT AACCAACATG AATCAATTGC TTTCAAAAAG ACTTTTTGAA CX3AAAATATT 
ATAATAATAT GCACTTTGCA TGTTTTTACG ATTCAAAGCT AATTGCTTTT CAAATTGCTC 

5 

TAATAAAAAT GTCACTACTG CTTGCTTATC TTTAAAATTA ACACAAGCCA CATCTTTATT 
AAATTGGAAA CTTAAATTTT GATAAATATA CTCGACAACA CGCQATTTTG TTAGCACCTT 
10 TTCCTCATTT ACAAACATTT CAAATACATC TTTAGCTAAC GCTTTAAAAT CTTGATTCTC 
AGCATCATCT' ATTTCTAAAA CTCGATTGCG TTCCTCGTAT ACAAGATCTC GCTGTATACT 
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AATGCTTTTT TCAAATTCAT TAGCCATTTC ACGAGCTTTA ACCCCTTGTT CTTCCGAGAt 
aCGcTGCGCT TTAACTACAA TTTGCTTAAC TTTGOGATTA AACAAATTAC TTTGCGATAA 
TCGTTGTGCA TCTAATGAAT ATAATTGATT ATTTTCCGCT AAATTACTAT CXSCTCCATCG 
CTTAACTAAA TAATCATCTA GTGAAATATA TATACAAGAT GATCCCGGAT CCCCTTGTCT 
ACCAGAACGA CCACGTAATT GCCTGTCTAC ACGGCTATTT TCCATATGTT CATGAATAAT 
AACAGCTAAT CCACCTAATG CTTCGACACC TTCACCAAGT TTAATATCTG TGCCTCGACC 
TGCCATACTA GTCGCAACAG TCATGGAACC AATTTGCCCT GCTTCAGCTA TCATCTGCGC 
TTCTITTGCA ACATTT TG CG CAATGAGTAA ATTATTAGGA ATATCCATTT GGAATAATAC 

TTTCGAAAAG TATTCAGCCG CTTCAGCAGT TCTCGTTATG AGTAAAACCG GTCGCCCCGT 

* . - ■ 

TTCATGAAGT TCAACTATAT CATGAATCAT CGCGATGTTT TTCTCATCAA CTGAACGAAA 
CACTTTATCT GGTTCATCGA TACGTTGAAT CGCTTTATCA GTTGGTACTT GTACGACTAT 
TTTTGAATAC AAATCAAAGA ACTCTGATTC GCCTAATTTT CCTGTAGCTG TCATACCTGA 
AAATGATTCA AAAAGTTTAA ATAAATTCTG GAAGGTAATT GTTGCCATAA CACTTTTATC 
TGTTGAAACC TCCATACCTT CTTTCGCTTC AATAGCTTGG TGAAGTCCAG CTTGCAACTT 
AGTTCCCGGT AACATACGAC CTGTAATACG GTCAATTAAA ACAATATCAC CATTATATAC 
AAAGTAATCG ACATTAGATT CAAACAAATA TTGTGCGCGC AGTGCTAAAT TAATATTACG 
CACTAGGACC ATCGCTTGTT CGCTATATAA ATCTTCAACA TTAAAGTATG ATTGTGCCGC 
TTCAATACCT TGATTTAACA GCCATATTTC TTTTTTGGTC TTCTTCATTT TAAAATGCAC 
GTCTTCAATC AATGTATCTA CAAACTCTTT CACAATATGA AATAGATTTG ATTGTAATCT 
TGGTGCACCC GAAATAACTA ATGGTGTTTG AGCAGCATCT AAAATGATTG AATCCACTTC 
ATCAATAATA CCGTAATTTA ATTGTGGTAA AAATTrCCCT TCCGCACTAT CAGCCAAATT 
ATCAATTAAA TAATCAAAAC CGAGACGTCC ATTAGTTGTA TATATAATAT CATGTTCATA 
TATATTACGT TTTTCCCCTT TTTGATACTC ATAATCCACA ATATCAACAA AACCTAATGA 



4020 
4080 
4140 
4200 
4260 
4320 
4380 
4440 
4500 
4560 
4620 
4680 
4740 
4800 
4860 
4920 
4980 
5040 
5100 
5160 
5220 
5280 
5340 
5400 
5460 
5520 
"5580 
5640 
5700 



55 



975 



10 



15 



25 



EP0 786 519 A2 

TAATCATTCG TTGTAATTAA ATATGTTCCT TTTCCCGAAA GAGCATTTAA ATATAAAGGC 5820 

ATCGTTGCCG TTAATGTTTT ACCTTCGCCT GTTTGCATCT CCGCAATGTT ACCTTCATGC 5880 

AATACAATCG CTCCGATTAA CTGAACTTCT TTAGGAXACA TACCTAATAC TCTCCAGCTC 594 0 

GCTTCACGTG CCACTGCATA AGCTTCAGGT AACAATGTAT CTAGTGTATC AACTCCTGAT 6000 

GCTAAACGTT CTTTAAATTC TATTGTCTTT TGTTTTAACG CATCATCAGA ATATGATTTA 6060 
ACTTCATCGC TCCAT6TATT GaTGsGTTcA CTATTTTTCT AATCGACTTT AGTCTTAATT . 6120 

CGTTTATCGT AACATCTAGT TTATGTTTCA TTTACTTCCC CACCATTCAG TTTCGATACA 6180 

TCTAAGTAAT CTAAAAATCG TACTGGATTC ATTAAACGTG ACATATAATT TAGATGTTTG 6240 

TCTTGCTCTT CrTTAAAATA AACCTCGACA TTTGTATCTT TTAGTTCATG ATTTCCTGGG 6300 

ACATGTTCTG TAAGCCATCC TTTTAAATCA TCATCTTCAT GGCTTGTACG ATACACTTTG 6360 

20 CAACCCAAAT GCTGAGCGAC ATAAGTTGCA AAAACATTTG ACTTTGACCC ATAACTAATC 6420 

AAATTAATAG CCTTTAGGGT ATCTTGACTT TGCAAATCAT TCTTTAGTTG CTTAATATTT 6480 

CCCTCGATAT TGTCGTCCAT CCAACGTTCA ACGAGCCAAA CATGACCAAA CAGTTTCAAA 6540 

AAATC:ATTCG AAATAGTTGG ATAGGTGTCA GATGGTTCTG CAATAATGAC ATTGATCATA 6600 

TCATTTCCAT ATTGGTCATC GCCTATCTTC GTCACCCGCA TGCTTTTATA CTCTAAATCA 6660 

TATTGATGCG TCATCTCTGT GATTGTTAAA CATCTAAATA TAAGACTCGT CGATGCTGCA 6720 

TTCATCATTT TTATTTTATA AGCATAGGCk TCATCAGGAT ATTGAATCGT AATACTATTT 6780 

GACTTTACAA TCTCAGTACT TAGTTTTGTG CCATTTTTAT TATAAAAAAT GATGATAAAA 6840 

TACACTGAAC CAGCAGGCGT TGCATCAAAA TCAAAATGCA ATTTATAATG CTGTCCTCTA 6900 

CGCAAAATTG GkAAACTTGG CGcACTTTTA ' TATTTTGAAA ATTGCTTTAA CATCAACCAC 6960 

TCATGAATCG GTAATCCAGA GGGCATCAAA GGATTTATAA AAGTCACTTC ACCATTTGAA 7020 

■ 

40 AATGATACTT TAGAGCCATA CATAAATGTA GTTTGTGAAA TATAATTCCA AGTAACTTTA 7080 
AATGTTTTGT TTTTCAGCAT GTTGAACTCT CCCAAACTTG TCTTCCAAAA TAATGTTGTA " 7140 

AAAATTAACA AACCAACTTG CAATGGTAGG TGAATCATCA TTATGTCGCC CAGGAATACT 7200 

GCGATTCATC ACTCTTGCTT GGTGTGCTGT CAATACAGGT AATAGCTCTT GAAATGCATG .7260 

TGGATCATAA TCATCATGTT GCATATATGC TATGGCAAAA ACAGTTTGTG ACAATGATTy 7320 

CTTTTGAAAT GTTTGCCAAA ATTTTTGATT TAATGCCTGT ATCGACGCTT GAGATGTATC 7380 

r 

ACCTTCATTA GACACCAGGA CGTCTAATGC TGTACCGAAC TCTTCTGGTC TAAGTAATCG 7440 

CATATGTTCA GCAATCGTTC CAATATTAAC AAGTGGTTTA CCAACAATAA TTGCCTGAGG 7500 
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TAATTCATGT GATTTAAAAT TCAGCTTTTC TAATGTCTCG TCAATAACAT TGATAATACC 
TTGTTCATAT TCAGATGAAC CGATATAAAA ACTACCACCT TCAACACGAG GATCGCCGAT 
AAGTAAAAAC GGTGCATTCA TACGTTTCAT CATATAATAT CCTTCGAAAC CTTCCGCTGT 
TCGATAACCA CTAAAATATA CGTTTAGTGG CGGTTTCATA TCACCAGGGT GGAAATAATA 
AATAAATTCC TGTCGTTGAC TATCTACGAA ACGACTACCA CCAAGTAAAA ATTGACCCAT 
GTCTAATCTA GACCATCGTT TGTGTATAGG TCCTAAATGT ACCGTCCCGT TCCCACGCGC. 
CTTAACAGTT ACACTTATAT AAGCATCAAA TGGTTTCGCA GGTATCTCTA AAGGACTGTC 
TAACATATCA TCAGTCAATA CGATTTGTTC AATTAATGCA CCATCAGCGC CAGTCTGAAT 
CAATCTAAAT GTATATTGCA ACTCGACCGC ACCATCAATA TCAAATTCTG GCCATATTTG 
AATGACTTTA TCTTTATCGT AAACGAGATT ATTTTGCCAA GATGCGATAG GTTTAAATTC 
TTTCCCAAAT TCTCCACTCA ATGTGAGCTC TGAATTACCT TGGTAAACGA CATCTCCTTT 
AAAATTCGGA TGCACAAGTG CTAACTTAGG AGAAACCTTA TCTCCATACT GTCCTGA6AA 
GCTAACTGCC TCTAATTTAT TATTACGTrC TTCAATATTC CGGTAATGTA ATGGTTGAAC 
AACGTATTTT TGGACATTTT CGTCTTGTTC ATATTCAACT GACCAAAATG ATTCATCAAC 
ATACGTATTG TATGGTTCGC TTATCATTTG TAATAAATTC GTTAATGTCT CCX5AGTATGG 
TGCTTGAATA TAGATAAAAT CAAAGCGCCC TTCTGCTTCA ACAATCGCTT CAATAGCCTC 
TACATAACCA CTATCAAATT CAAACAATCC AATATCGAAG TAATCCCAAC TCACACCTTT 
TTTGTGTTGA AAAATAGGTT CTAAATCGTC TCCTCCAATT TGCAAAACTC TAAATTTACG 
TGGCATCATT TTCACCTTCT ATTAACTCAT CGAGCTGATT AATAATATTC TTAGAAGCAT 
ATGCATCTAT TAATTTTAAA GAATAGGCGT ACGCATAATT CCAATTTTTC AAATAAAATA 
AATAATAATT TAACGCATCA TCTAATTCAT CAACTGTATT TATAATACGG CCATTGTCAT 
AATCAGAGAC GTAATCTGTT TGTTGACCAT TAATTTGTGG AATCCCAGCG CTAATTGCAC 
TAATTTGTAA ATACAAGTCA GGTTCTTTTG ACATATCTAT CACAAGTCGC AACGTCCGCA 
ATGCTTCTAC AACATCATGT TCAGCATGTA TCGTCTTAAC AGCAATGATG TCATCTTGAT 
CTTCAGGTGT CATTAATGCT GAAACATTAA CATCCGCATT CTGTTTAGCT TGGTATTCCT 
CATTTACCGA CGTAATACAT TCACGAAGCC ACATCGGTAT GTCATTTTGA TGGCGCGATA 
ATAAAATTAA ACGGTAATAA TCTTCCTGTG CGATATAATC CACAAGTCGT TGCATCATTT 
GTTGCAAATC AGCGTCACTC ATACCATCTA TCCATACACC TATAAATGTT TCCATCAATT 
GACTACTTAT ATTAGGTGAT TGTCTCGTTT CAAATGGTGT GATTCGAATC ATTGTATTCT 
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TTAAATGGGC ATTCTTTACG ATAGATTGAT ATTCCTCATC TGACACAGTT TCATTTCTAT 
TTTTAAAAAA TGAATAACTT AATGATTTCX3 CTGGAATATG ATTGGCTATT TGTCGATTGT 
GCCTAGCATC TGAAGCCACA ATCACATGAT CATCTTCATG TATTTGTTGT GCAATCATTG 
CTTGAAATTT TTCTTCAATT AGTTGAGCCA TATTGTTATA TTCTGTTTGT TGATAGTGAT 
GTTGATATCT TTTTGAAACA GTGACTCTGC CATTTTTCAA ATCTTCATGA AGTACACAAT 
CTCCATTAAT CGTTAAATAT TCTTGGTAAG AAGCCTCTCC CTGATCATCA AAATAACGTA 
TCGCTGATAA ATAACCTCTG TCATCAAAAA TATAACGCCG TTGTAACTGA TCTCTTTCAA 
ATTCTTCAAA CCAAATTGAA TACCCTTCTT GACTAAAATA AATATTTGTA TAGGTCTGTT 
CACTCGTCAC ACATTTTAAT AAATACGGTG TGTACACAAA CTCAACATCA TCCGGCCATT 
TTAAGTGATG ATAATTAATC GCTTGTGGCG CATGGTGACT GAATCCTTGA ATTTCATCAA 

• ♦ ' • * • » ' 

ACACAGACGA ATACTTTGTC TCATATAAGT CATATCGATG TAAAAATGTT CTTAAATTTG 
GTGCATGATT GAGAACAATC AGTTGATAAT CTAAGTCATT TTCAAGGTGC ATTCCCATTA 
AACTAATCAT ATCGTCAAAT TCCGTCTTAT TTTGTAGTTG ATAATACGGC ACAGTCGTGT 
CTTGCCACCA TCGTTGGTCA TCGTACCAAG CTGGAATAAA GTATTTCATA ATTACCTCCT 
TACCAATACT GGTTTAAAAA TGGCTTATAT TTATCAAAAT ATAAATATGT ACGAATTGTT 
TCTGCAATAT TAATACTGAT GTAAACTAAT ACAATCAGTT GTACTGAGaA ATAAATTTCA 
GTAGATAAAT GCGGTACAAA CAATGTGAAA TAAAGCGGTA TACCAATAAT GACTGTAACT 
AATGCCAATC CAAACCAACA TACGCGTCGT GCTTGATAAT TTAAATAACG TTCTGTATCC 
TTACCAGGTT TaACTCCTGA AAAATAATTG CCACTCTTTA AGAAATCTTT GGATTTTTGT 
TTAGTATTGA' TTAAAAATCT CGATAAAAAA TAACCCAATA ACATTTGAAT CACTAAATAT 
ACTGAAATAC CTACTGGACT ATCAAATGTC AGCATTGGCA TGTCATCTGA TATGCTTTTA 
TTAAACATAG ATAAAA7AAA ATGAATGCCA CTTTTTAAGA AAACAAAAGC TGAAATACTC 
ATCATTAAAG TAATACTGCC TGCAGGGTTA ACTTTCCAAG ATAAATAAGA TTTCATATTT 
GTTGCGGAAA CGTTCATTAA ATCGATATAT GGTATTCTCA CTTCTACTAA TTCAATAAAT 
AATAAGATAA ACAATGTGAT TATCACAAGG ATGATTAACA ACGCAATCAC AATATGACTT 
GCATCTATAT ATTCCATTTT TTGATGCATC ATTGATTTAA TAATACTAAC CATTACAATC 
GGCATTGGTC CTGCGATGCC GTAGCGACTA TTTTTGTCAG CTAACCAAAC TAATAACATC 
GTTCCAGTAA CCAAAATCAA TATTGTTAAG TAAATATTGT CTTGATGAAC ACGTTCTTTC 
GAAACATATT CATGAATCAC AAAATAACTT TGAATAACAC TTAAAATTAA TGTTAAGATG 
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GAAATCAGCA TCAAGATAAT CATTGATGTT AACCACGGAC CTAAtCCTAA AGTGAAAATG 
TTTAAAGTAT TAACGTCTCC ACCCATATTA GAAATAGCTA TTTTAAAAAA TGACTCATGT 
TTTACTTGCA TATCGTTaTA GGAAACGATG GAAATGITTG TGCCTAATAT ATAAATAaAC 
AAGATAAAAC ATGTGTATAG CATACGTTTA TATATAATTT TATATTCGTA TTGTTGTAAA 
AGTTTTAACA TGTTGCACCT CTTTTATATC AAAAACATTA AAAAGACTAA GGGTTCATCA 
CTAATTATTA AAATCCTATA TCGATTTTTC TAGTGATTGG TGCCTCAGTC TTTTTAATTT 
TAGCCAGCTA TAAATTCAAT TTATGCTTGA GAATCATCTT GATCATTTTC ATCTTTCTTT 
TTCTTTCTCT TCATTAAACC TAAACCAACT AATAATGTCA TAACGCCACC TAGTAATCCA 
TTTTGTTTTA TTGAGTCACC TGTATCTGGC AATCTTTTTT CACTTTGTGC TGGTGTGCCA 
TTATGTTTAG TCACTTCAGA TGTrOCACTT AATGTAGACT GAOATTCACT COTOCTCOTT 
20 GTTGCTTCAC TTGATAAGCX3 AGATGTGCTC GTGCTGTGAG TATGATGCAT ACTCATTGAG 
TCTGACGGAT GCATTGAGTT AGATTCAGAT GTACTTGTTG AGCCGGACAT ACTTGTTGAT 
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GTTGAGTCAG AAATGCTTTG TGAACCAGAC ATAGATGTAC TCAGTGATTC GGATGTGCTT 
GTCGAATCX5G ATGTGCTCAA TGACGTTGAT GTGCTTGTTG ACACTGATTC TGAGTCACTA 
ATTGATGTTG AGTCGGATTT GTCTTGTGAC ATTGAAACAC TCGATGAATT AGATTCACTC 
ATTGATGTTG AGTCAGATAC GCTCGTTGAA CCTGAACCAG ACGTACTTAA TGATTCAGAT 
ATGCTTGTTG AAGTTGAACC ACTTGTTGAG TCCGATGTAC TTGTCGATGT CGAGTCTGAA 
TCTGATGTAC TCAATGATTC TGAGTCACTG ATAGAAGTTG AATCACTTGT AGATTCTGAT 
TCTACTGTAC TTTGTGAACC ACTGATACTT ATTGAAGTAG AATCACTGAT ACTGTCTGAT 
GTTGATAAT6 ATGTCGACAC CXSATGTGCTT TGTGATGACG ATGTACTAGC ACTCATTGAC 
ATTGMGTTG ATATCGATGT ACTTAAGGAA CCAGATGCAC TTGTACTTGT TGACTGGCTT 

■ 

TGTGACATTG AATCACTTAA TGATGTAGAT GTGCTTGTTG AGCTCGAGTC ACTTACACTT 
GTTGAACCTG ATATTGAGTC ACTTAAACTT GTCGATGTTG AAACTGAtwC GcTTCCGCTC 
ATTGAGTCAG ATGTTGAAAG TGATGTACTC GTTGAATTTG ATCCACTGAT GCTAGACGAA 
TCACTD3TAG ACATTGAGTC GCTTTCTGAT GCACTGATGC TCATAGAGTC AAATTGACTA 
TTACTTGTTG AGCTTGACTG CGAATCGCTC ACACTTGTTG ACGTTGATTC TGATCCACTC 
ATACTTTGCG AGCTACTCAA TGATTTTGAA TCACTTAATG AATCCGAAGT GCTAAGACTT 
GTGGAACCAC TTAAAGATAT TGATCCACTT AATGAGTCGG AGTCACTTGT ACTAGTAGAA 
TCACTCATTG ATATTGAATC ACTTAGcGAG GTAGACTyGc tTACGCTTTC TGAACCACTT 
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TTTGAATCAC TTAATGAATC AGATTCACTC ACGCTTTCTG AACTTCTTAG TGACGTCGAT 
ACACTTAATG ATGACGAATC GCTTGTGCTT ACTGAATCG 
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(2) INFORMATION FOR SEQ ID NO: 221: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 10758 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: I 
AGGGATGGCC TTACCTAAAA AACCGGGnAA 
CCCTTTAAAA TGGTAGCATT TAACCGCCAC 
20 ATTTAAATTA GTACACCATG CAGATTCTGT 
AGCAACTGAT AAAAAAATAC GTCCTAAGGC 
GGCTAAGAAA ATAGAATTTA AAATTAAAAA 
GAAAATTGAT GATTGGATTT ATTCAATTGA 
TTATTATCCA AGTGTAGAAA ATATCCAAGG 
TCATATTAGC GGATTGAAGA AAATAGATGA 

ZO 

ACAAGAAAAT TACTTAACAG GATTTATTAC 
AGATGTACCA ATTAAAGATT TAGCGAAATC 

3^ TGGACCGTAT AAAGTTAAGA AAATCGTTCC 
TGATTATTGG CAAGGTAAGC CTGCACTAGA 
GCAAATTATT AAGGCAATGG AAAAAGGCGA 

40 AATGGCAAAA GATGCTAAGT CATCTAATGC 
AGACTACGGT TTAATAGGtT CGTATCTCAT 
AAAGTGAGAC CAAAATATGA AGACAAAGAA 
AGAGAAaAAT GGATCAAAGC GTTTTTCAAT 
CCATCTATGC ATTGGATAGC AGCCAATCCT 
GAAAAAGCTA AAAAAATCTT AGATAAGTTA 

50 

AGAGAAGATC CTAAAGGTAA TAAATTTGAG 
' *" CCTACTTTTG AACCAAGAAC TGCTGCGATA 

55 



SEQ ID NO: 221: 

ACCCTCCAAA ACCCATTAAA AGGnTGGnTA 60 

CCGCCAAGGT GGGTGGTTTA TTCTTCCGTT 120 

AGTTGAGGGA TATTTTAACG AAAGCTTATT 180 

ATATATTGCT TCATGGAAGG ACATCGAGCC 240 

AGGTATTAAA TGGCATGATG GTAATGAATT 300 

AGTCTTAGCT AACAAGGACT ACGAAGGTGC 360 

• * - • 

TGCGAAAGAT TATCATGAAG GAAAAACTGA 420 
CTACACTATG CAGGTTACAT TTGATAAAAA • 480 

TGGACCTTTA TTAAGTAAAA AATATTTATC 540 

AGATAAAATC CGAAAATATC CTATTGGTAT 600 

AGGTGAGGCT GTTCAACTCG TTAAATTTGA 660 

CAAAATCAAT TTAAAAGTTA TTGATCAAGC 720 

TATTGATGTT GCGAATGATG CTACCGGTGC 780 

TGGTCTCAAG GTATTATCTG CGCCAAGCTT 840 

GATTACGATA AAAAAGCTAA TAAAACTGGT 900 

TTACGTAAAG CAATGCTTTA TGCAATTGAT 960 

GGTTACGCTA GTGAAATCaA TAGTTTTGTA 1020 

AAGGACCTAA ATGATTACAA ATATGATCCT 1080 

GGTTATAAAG ATAGAGATGG TGACGGATTT 1140 

ATTAACTTTA AACATAATTC AGGTTCTAAT 1200 

AAAGATTTCT GGGAAAAAGT TGGCTTGAAA 1260 



980 



10 



15 



EP 0 786 519 A2 

AATACGATTC CTGTTTATAT GCCATATATC ACATCTTATT TCATGACGCG TGCTATCGGC 1380 

■ • ■ ■ • 

GACAGACCTT TAGTCGTCCC GCATCAATCT CAGAACTTAG CATTTATTGG TAACTTTGCA 1440 

GAAACAGAGC GAGACACTGT ATTTACAACA GAATATTCGG TTCGTACTGC CATGGAAGCT 1500 

GTTTATCAAT TACTAAATAT AGATCGTGGT ATTCCAGAAG TCATCAATAG TCCATTTGAT 1560 

CTTCGCGTCT TAATGGATGC CATATACGAA CTGAATGACC ACCAAGATTT GCGTGAGATT " 1620 

ACTAAAGATT CGAAAATGCA AAAACTCGCA TTAGCAGGAT TCCTTAAAAA GATAAAAGGT 1680 

ACGTACATTG AGTCATTATT AAAAGAACAC AAATTGTTAT AACGAAAACC ATTAATAGAT 1740 

TTTTAO^rTGG TGATTTCAAA TCATGAGACT GGGACAGAAA TGATGTTTTC ATAAAAATTA 1800 

TTTCGTTGTT CCACTCTCAT GATTTTTTTG ATGAAACATA ATTACATGAT TGATTGCATC 1860 

ATTTTGTTAA ACAAGTGATT GCAAACCTGC CATTTCACAC TGAAAATTTA CATAATAAGT 1920 

20 GACGATATTT TACAAGTCAT ATACAAATAA CATATATTGT TAAATAATTT TACCTAATCT 1980 

TAACATTAAA TTTACAATTA TAAGCGATAA TCTAAATATA AAGCTTATTT GAGGTGAAAT 2040 

AATGGAAATG TCGGTTACAG AAGTCATTTT CTCCTTTTTA GGTGGTTTAG GTATTTTCCT 2100 

TTACGGCTTA AAAATCATGG GAGACGGGCT TCAAGCATCA GCAGGAGACA GGCTACGAGA 2160 

TATTTTAAAC AAATTTACAT CAAATCCAGT ATTAGGTGTT ATTGCAGGTA TCGTTGTAAC 2220 

- TATTTTAATA CAAAGTAGTT CAGGTACGAC AGTTATCACA ATCGGACTGG TAACAGCTGG 2280 

ATTTATGACA TTGAAACAAG CCATTGGAGT GATAATGGGT GCTAATATCG GAACAACGGT 234 0 

AACTGCATTT ATTATCGGTA TAGATTTAGG CGAATATGCA ATGCCAATTT TAGCATTAGG 2400 

TGCATTCTTA ATCTTTTTCT TTAAACGCTC TAAAATCAAT AACATTGGCC GCATACTATT 2460 

CGGTTTCGGT TCACTATTCT TCGGTCTAGA ATTTATGGGT GATGCCGTTA AACCTTTAGC 2520 

ATCAStAGAT GGATTTAAGC AATTAATGCT TGATATGTCT ACAAATCCAA TACTCGCTGT 2580 

40 CATTGTCGGC GCAGGGTTAA CAGCACTAGT TCAAAGTTCA AGTGCGACGA TTGGTATTTT 2640 

ACAAGAATTT TATCAACAAG ATTTAATTAG CTTAAACGCA GCAATCCCTG TGTTACTAGG 2700 

CGATAACATT GGTACCACGA TTACAGCTAT CTTAGCTAGT TTAGCCGGCT CAATCGCTGC 2760 

AAAACGTGCG GCGCTTGTAC ACGTCATCTT TAACTTAATC GGGGTAATTA TCTTCACAAT 2820 

TTTCTTGCCA GTTGTGATTC ATTTGATTAG TTTGTTACAA GATTTATGGC ACTTAAAACC 2880 

AGCGATGACG ATTGCAGTAT CACATGGTAT CTTCAACATA ACAAATACTT TGATTCAATT 2940 

ACCATTTGTA GCAGGTTTAG CATGGATTGT TACAAAGCTT GTCCCAGGTA AAGATATTGC 3000 

TGATGACTAT AAACCTCAGC ACTTAAACAA AGATCTTGTT TATCACGCAC CTGGTGTTGC 3060 
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A6ACATTCGC GAAATTACAA AAGACGAXAA AAAATTGATC AAAAAGCTTG AACAAAAGCA 
TCAAGCTGTT GAAACAATCA ATGATAGCAT TCXSAAATTAT TTAGTTAGAA TTTCTACAAA 
AGCCATTACG AAGGCAGACG TTGAGCGTTT AGCAGTTATG TTTGATGTCA ATCGCTCTAT 
TTTAAAAGTA GCAGAGCTAA CAGAAGAGTA TGTCGCTCAA TTAAAACGCC AACATGATGA 
AGATATTCGC ATTACAGAAG ATGCACAACG CGGTATGGAT AAATTATTCA ACCATGTTGC 
TGAGTCATTT GATAAAGCCA TCGACATGTT AGATGTTTAT GACAAAACGA AAAAAGATGA 
AATTGTAGAA CGTAGTAGAG AATCATTTAA TATTGAACAT AAACTACGCA AAGGTCATAT 
TAAACGCCTT AATCGTGGTG AATGTACAAC AAAAGGCGGA TTACTATATA TCGATATGAT 
TGGTGTTCTT GAACGTATCG GTTATCATTC ACGAAATGTT TCTGAAGCAC TTGTTGGCCT 
TAACGATGAT GTACCTACAG ATGAAGAAAT TGCAACAACT GAAATTTAAT TTTTACTGTC 
TTATTTATAT TCATATTTTT TTAAAATTAG AGATTCAGAT GCATGTAAAA AGCCAATCCA 
ACATTCATGG GTTGGCTTTT TTGTTTAGCA AAATTTATTA TCTTAAATCG GCTATAAACA 
CTGATATAAT AATGCTTCAT TAGTATGCGG TAAGCATGAC OGACACTGTT CTCGGAGTCT 
GACCCCGAAA CGTTTAATAT ACACTTTTAC ACGTCGCCTT CATTGAAGCG AATTGCCATA 
ACCTTCACAT TATATATAGT TCTTTCCATA TAAATGTCCA AATTTTTAGA ACAACGCAAT 
AAATAACCAT CCACCTAACT TATCAAAAAT TTAAGTGGAT GGTTTTTCAT TTTCATTTAT 
ATTTATATTA GTGTTAATCC AATCATAGAT TTATCTATAT GCACTGCTCT ATACATTTCC 
TCATTTAATT TGCTTTACTT TCATTTATAT CATTATCAAA ACACTTGGCG TGTCATCGTT 
ATTATTTCGC ATCTTTGACA CGTTTATCAT CATTAGGAAT CGCGAATAAA ATTGCX5ATAA 
ATGCCATGAT TCCCATTAAT ACGTTAACCC AAAGTGCAAT CATCGCACCT GTATGAATGC 
TCGTTGCAGC AACTGCACCA GCATATACAG CACCACTAAT TGCGACACCG AATGCGCCAC 
CAAGTGATGA AGCCATrTTA TAAATACCTG AAGCAACGCC AACTTTATCT AACGGTGCAT 
TCGAAATAGC TGTATCTGTA GAAGGTGTTG CATAAATACC TAAGCCTAGT CCGAAACATA 
AATATCCTAC GACACAACTG ATAACATAAA ATATGCCTGG TAAGAATACT AATGAAATAA 
GTGCAATACC AATGACCACA ATGAATGTAC CTAATAACAT TGGTCGCTTA GAACCCATTT 
TTTGTAATAA TTTTTCACCA ACTCGAATCA TCAATAACAC CATGATTAAA TAAGTAATTG 
ATAAGTATCC TGCCTGCAAT GCTGTATAAC CTAAACCTTG TTGCACGAAT GTATTCGCTA 
CAATTAATGT ACCTGCAAAA . CCGTTTAATA AGAAGTTOGA AATCGTTGCA CCTGTATATG 
GTTTATTTTC AAATAATTTA AAATCAATAA GTGGATTATC f ACTTTTTTC* TCAACATTTA 
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AACCAAGTGC TGCACCTTTA GTAATGACAA CGTTTAAACT TAGCAACATA ACTACTAGAA 
CAATTAGCCC TGCAACGTCA AATTTATGTG TATTGGTAAT TTCTGATTTC GTTTCAGGCG 
TCCCTTTGAT GAGTAACATT GAAAGTACGG CAACGATAAT TGAGAAGATG AAAATCCATC 
TCCAACCCAT AGTTGTCGCA ACTGCACCAC CGAAGAGTGA ACAGATACCA CTGCCACCCC 
AAGAACCGAT AGACCAATAA CTTAAGGCAC GCTGACGTTC AGCACCCTGA TAATAAGTTT 
TCATAATGGC CAATGTAGAA GGCATAATAC ACGCTGCTGA TACACCTTGT'ATAACACGAC 
CTAAAATTAA TAATGCCGGT AAATTCGTAA TAATAATTAA TGCTGAACCA ATAATACTTA 
ATAATAAACC GATATTCGTC ATTTTCACGC GCCCAATTTT ATCTGCCAGA CCACCTGCTC 
CAACAACAAA CATGCCTGAA AATAGTGCAG TTAGACTGAC CGCAATACTA ATTGTCCCCA 
TGTCTGTACC AAAACTTTGT TGTAAATTCG GTACAACATT TACAAGTGAT TGTGCAAACA 
ACCAAAATGT AATAACACCT AATACAATAC CTAAGATTAA CTTGTTGCCC CCGCGATACG 
TTTCATTCAT GTTAGTTATC . TCCTTTAAGG TAATCTAAAA ■ CAACTGTCCC TACTGCTTCT 
GCAGAAATAA GTAATGATTT TTCTGAAATG TTAAATTTAG GATGATGATG TGGGTAAATT 
TCACCATTTT CCACCGCTGC ACCTGTATAA ATAAAGGCAC TTGGGCGTTC TTTAGCATAA 
TATGCAAAGT CTTCTGAAGG TGGTTGTGGT TCACACATTT CAACACCAAA ATCAAGGTTT 
GCTTCTTTCA ACGTCTTAGC CACGTACTCA GTAAACTCTG" GATCATTATA TAATGCTGGA 
TAATCATCGT TATATTCTAA GGTGCAAGTt ACACCATACA TATCCTCTAA TCCTTTTGAT 
AAACGTTTAA ITTClTi'TTC AATTGTTGCT TTTGTAGCAT CTGTTAATCC ACGTACATCA 
CCTTCAATTT CAACAACATC TTTAATGACA TTGAATTGAC CTTTACCGTC AAATGAACCG 
ATTGTGACAA CACCGGTTTC AAATGGACTT AGTCGTCTAG ATACAACTGT TTGTAACGCT 
GTGArGAAGT AGCTACCTGC AACAATGGCA TCATTGGCCA TATGTGGTGA TGAACCATGA 
CCACCTTTAC CTTGAACTTT CAATTTGAAG AATGCGCGTC CTGTTTGAAC ATAACCAGGT 

ctgtaataca ctttacctgt tttcattgtg ctcatgacgt gtacacctaa tacatqatca 
acaccgtctA atacaccatt ttcaatcatt gttttagcac cacctggtgg tacttcttca 
gctggttgat gtatcacaac gacttttcct gtaaaactat ctttcatttc agcaagcgtc 
tctgctaata caagcatgta tgctgtatgt gcatcgtgac cacatgcgtg cataacacct 
ttattttgtg atgcaaaaga taatcctgta tcttcagtaa tgggtaatgc gtcaaagtct 
gcacggattg ctaatgtttt accaggtttc cctgaatcaa tcgttacttt aattccacgt 

GGTCCGACAT TCGTTTCTAC TTCCACATCT TTACCTrTGT- AAAATTCAGC GATGTATTTC 
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ATCATTTTGC CTTCTTTAGA -TTTTAAAGTT TCAATTAATT GTTGATTCAT ATCCTTCATC. 
TCCTTAGTTA CATCATAAAT GATTAATCAT TATTTATATT GCCAACAACA GAGATGTTAA 
CCATTAATTT TTTGCAATTT TAGCTTTGAA TATAAAAAAT CACAAATTAT GTATATCAAA 
ATTTGTGATT TGTGATCATT TTATGAACTT GGGTAACGTT TTACTTCAAT TAAGTGAATC 
CCATTCGTAA TCATTTTAAT GTTTAATGCC AGTGTGTCCG TGATATCTAT ATCATATACT 
TCTAATTTCG GAAAACTCAT TCGATTAACG TAATCTATAG AGTCCTTGTC CATGCCATGT 
ATCGTATGAT GTTTGCGCCA AAGATTAAAT AACGCACCAT TTTCTTTATC TAAGGTAAAA 
TGTTTAATCT TATACATACC TTCTTCCAGG GCATTAATGT TCAAATGAAT CATTTCCGTC 
GCACGCATAT TCATTTGATT GTCCAACGCT AAGTACGGAT TAAAATGCTT TGCATCATAT 
AACAATATTT GAAAATTTGA ATCAGTCCCC GTGACAATAC ATGTATCATC AGAATACAAA 
ATATTGCTTG TTAATTTATT AAATAGCAAT GCCGTGAAAT AGACCX5GACG TTTTCCATTA 
TATTGATGAA ATAGTTCAAT .AGAATTCATA TAATCCCGTT. CATTTTTACA ATGACTGACG 
TGCAAATCAT AATTCAACCA ATACCCGATA CCCTCTACTT TAGAACTTAA TTTTAATAAT 
TGCTCAATGA TGATACCACC TCTAAAATAT TCGCCGTTTG TAATAAATGT ATCACCCGTC 
AATGTATTCC AATTGAGTAA AATGAGTGGA CGCTTTAGGC GATGACGATG CATTAAGTCG 
ATAAGGTAAT TCGTTTTATT AATAAXCATT TGACTCGCGG TTTTAAATTC ATCATCATTC 
ATTTTATTAA AATCAACAGC GTCATTTGAA TTGGCATCAA ATACAAAATG GTCGATGTGT 
GGCTCAAGTC GTTTCAATAA TGGTAGATGT CTTTCCGTAG CTTGATCTAA GTGAATGTAC 
AAGCCACCAT TAGGGAATAA TGCTTTAAAA TAATCAATCA TTTCAATCAA AGACX3TGTGC 
AATGTCGTCA CATACAAGTT GAACTTCAAA TCTTTTCTAT GACTGACATG CAGGGCAACG 
TGATGGATAA AAATTTTAAA TGCATCGATA TAATCACGTG AGTCATACTG ATCCAAATGC 
ATGGTCAAAC TAAAGTTATG ATCTAATAAA AAGTCTAAAC ACAAATCAAT ATCATAAAAT 
ATATTCGAAA TTTCTGCATC ATACGTGAAT GGCGCATTGA GCTTTTTCAT GATATATGGA 
ATCACATCAT ATGCTAATAC TTCATTGACT TGAAAATCAT GATGACATGT AAGCAACTGT 
GATTGATACT GTGTATTGAG CAAATTCCTC AAATAGCCCA CTTGAATAAT ATGATTAAAT 
TGATTTAGTT GGTGATTGGT TGGTTGAAAG GCAATCTCTT TATAGTTCAT CTTTTCAATA 
TCTTCAATAA AATGATTCAT TTCTTCAATG TAGTCATTTA AAAGTAATAT CAATTCACGG 
TCGTGATAAT CATGTTGTGC CGATTGCTGG TTTTCAGTGA TTGCTGGACG ATCACCTCGA 
TATTGTTTAG GTGTTTGATG CGTAAAGTGT TTAAATGTTC TOGCAAAGCT CGCTGCACTT 
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TTCGCATGCT CAATTCGCGT CGTATTTAAG AAATGATGGA ATCCTACACC TAGCGATTCT 8580 

GTAAACTTTT TAGACAGATG GCTCTCTGAC CACCCAACGT ATTCGCTTAA TTCTGAAAGG 8640 

CTTAAATCTT CATGAAAATG TAACTCGATA TAGTCGCATA CTTGATTCAC TTTATCATCA 8700 

TTTAAGATAC TTTGGTTCGA ATGATATGTA cGCGGGACAT AATGAATCAT ATGCATAAGC 8760 

AACTGAATCA CAAGTTGTTG CTCAGTCAAT TTAGACAACT CATTATGTCG GATATGTGTT 8820 

GAAACCAGTC TTGCCATTAT ATTTCTCAGT TGATGTATAT TCTTTGTTGT GGTCGCATCT 8880 

GTTAAGTGAA AATATAGACA ATGCACATCA TCAAACTTGT CTGCTAAATA TTTCATTTGG 8940 

AATTGGATAT AACATATGAT GCCATCTTGT TGAAGTTGAA ATCGATACAA GTCGCGGTGG 9000 

TTAATGATGA AAATGTCGCC ACTGTTGCAT TGCGTCATAT TATTTTCATC ATAAATGTGT 9060 

GCCTCnCCTT TAATAACAAA ACCAATCATT AAACTATTGA GCCTTTTGAA ATCTGACATA 9120 

CTCTCAGTTT CTACTCGAAT TAAATAATCA CGTTGCATAC TATCCCTCAA TTCAGTAATA 9180 

TGAATACGTT TATTTTACAT- TATTTTACAG CAACATATTT GAATTTCATA TTGAATCGTG 9240 

TGTGTGGATG ATTATTTATC CTCACTCGGT TCAAGATGTA GACTATCAGT AAAAAAAGTA 9300 

TTTTCACCTT TTTTCTCCAC AAAAGTAAAT TCAATGTCTT TATATCCAAC TGrTGaACCT 9360 

TTTAAGTCTC CCgAACCTTT CaACaATAAC TTTGGTGCTT TATTCGTTGG TATTTTATAT 9420 

CTTTTTCGTA ATTGTTTTAC ATTATAGTCA TCATTAGTTA ATTGATATTT TGCTGAATAA 9480 

CTCGGTACCT CTGGATTATA TGATATATCG CCGTCTTTGT ACTTCGACAA ATCTTTAAAG 9540 

CTGCCATATT GCGCGAAGAA CTTAAAATTC TCGATTTCTT TTTTTATATT TTCGTCTTTG 9600 

ATACCTTTAG TTGGAATGAT TTTATTGTCT ACCATTTTAA CGGGATATTC TTTATCTTTA 9S60 

CTCTTAGGTC TACCATCTTC ATCATGAAGT GTTTCACTCA CTATATACTT CCCGGTTGTA 9720 

GTCTTAGTGT TTCTATTCAT ATATAGAACC ATACCTTTTG ATTTCATACG TTCCCCTTTA 9780 

to 

GGTTGAACAA CCATTTCAGA ACCAATAATC CATGTACCTT TATCATTTTT ATCAAATTCG 9840 

TCATCACGAT AACCTTCTTT ATCGTATAAA TCCTCTAGAT TTTTAATCGG ATACATACTC 9900 

AATGTTTTTT CAAAGCTTTT CTTAACTTCC GCTTCTTTAC CTATGCCACA ACCAGCAGTG 9960 

AAACTAATGA CTAATATCAA AAAACTAATA TACAATACCA ATTTGTTTAA TCGTTTCATA 10020 

ATTTCACAAT CCTATTCTTC TTATTATCTT TCCTGGATTG ATTTCATATT TTGATCGAGT 10080 

CATGATTATT TATCCTCACT TGGTTTAAAA ATTAACCCAT CACTAAAGTA AATGTTCTCT 10140 

TCTTTTTTCT CTACAAACGT AAATTCAATG TCTTTATATC CAACTGATGA ACCTTTTAAA 10200 

TTCCCTGTAC CyTTCAACAA CArCTTCGGy GCTTTATTTG TTGGTATGTC ATATCTTTTA 10260 
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ACCTCTGGAT TATATGATAT ATCTCCATCT TTATAATTCA TTAAATCTTT AAAATTGCTA 10380 

TATTGCGCAA AAAACTTAAA GTTTTCGATT TCTrmTX'A TGTtTTCTTC TTTAACTTCC 10440 

TCAGTAGAAA TGAATTTATT ATTAATCATT TTAACTGGAT ATTTTTTTTG ATTATCCTGA 10500 

GCTACTTCGT ATTTCTCCGT CTTTAtTTCA TTAGTATAGT AAAAtCCTTT TGCACTTCTT 10560 

GTATTTCTAT CTATCTTCAA AAGCATGCCT TTTATTTTTA GAGCTTCTCC TTTATTTTGA 10620 

ATTGCCATTT GAGAATTTAC AATCCATGTT CCCTTATCAT TTTTATCAAA TTGATCATCA 10680 

CGATATCCTT CTTTATCGTA TAAATCCTCT AGATTTTTAA TCGGATACAT ACTCAATGTT 10740 

TTTTCAAAAC TTTTCTTT 10758 
(2) INFORMATION FOR SSQ ID NO: 222: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1109 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
- . (D)- TOPOLOGY: linear 
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• (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 222: 
nTaTCaACTT TGGaATTTAA AgTCAATAAC TTTTTTAAAA ACTTTTTGTG TTCACAACCC 
GCTTCTTTTT CAACGCGTTT ATTGCTTAAC ACAAGAACTT ATTTTACCAG CATTCCAAAA 
CAAATCAACA TAAAAACGTA CAAAATAAAA GTAATTTTGT ACGTTTAGCA TATATTATAC 
CTATTTATTT GTAGCAGCTA TAACTTTTTG TGCAATCGAG CTATAAATTT TACCTAGACG 
ATCATCTGAT TGATATATTG ACGGTGCAAA ATCTTTTGGA TTCCAAGATG GTTGCTCTAA 
AGGTAATTCC CCAAGTAATT GAGTATTAAG TTCATCAGCT AACTTAGTAC CGCCACCTTT 
GCCJ5AAGACA TATTCTTTAT TACCCGTCTC TTTACTTTCA AAATAACTCA TGTTTTCAAT 
TACGCCAAGA ATAGAATGAT CCGTATGTTT TGCCATCGCA CCTGCGCGAg CTGCAACAAA 

TGCTGCTGTA GGATGAGGTG TCGTTACAAT AATTTCCTTA CTTGAAGGTA ACATCGTATG 

... • 

AACATCTAAA GCTACATCTC CTGTTCCAGG TGGAAGATCG AGTATTAAAT ATTCAATGTC 
TCCCCATTTA ACTTCTGTAA AGAAATTCGT CAACATTTTA CCTAACATTG GCCCTCTCCA 
TATAACTGGC GCATTTTCTT CCACAAAAAA GGCCATTGAT ATAACTTTAA CGCCATGACG 
TTCAACTGGA ATTACTTCCT TCCCTTTAAT TCCAGGCTTT TCATCAATAC CCATCATATC 
TGGTACACTA AATCCATATA TATCGGCATC TACTAATCCG ACTTTTTTCC CTTCACGAGC 
TAAGGCAACG GCTAAATTTA CTGCAACAGT AGATTTACCG ACACCACCTT TACCGGAGGC 
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ATTTTCTTCT TTTGGTTTAA ATTGATTTAC TTTTTCTTCC GGCAATGTTT CAAATCGTAT 
ACCXaACCGTT TTCGCACCGT TTTCTTTTAA TGCATTAACA ACAGCCATCT GTAAATCTAA 
aTTGCGtGCA CCACCTAATT GTCCCATTG 
(2) INFORMATION FOR SEQ ID NO: 223: 

(i) SEQUENCE CHARACTER I STI CS : 

(A) LENGTH: 3997 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY; linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 223: - 
TCTTTATTTA AAAAAATGAT TGTCTAGTTT GTATCTCTCT GAAGATTTGG CAATAAATAA 
AAGCCGATAA CCGTATAATG ATTATCGACT TAAAGTTTAT GTGGCATTTT TTACTTTTGT 
AATTTCAGGT GAGTTAGATG ATTATTATCA GATAGATTAT TGCTTATAAT . CATATGATGT 
TTGAATGATA TCTTTGATTT CACTGATTAG TGCTTCTTTA GGATTAGCAG TTGTACATTG 
ATCTTCAAAT GCGAGCTCTO CCATTCTATC AATTGACTCA TTTAATTCTT CTTCAGACAC 
ACCTTGTGAT TTCAAATTCA TTTCAATTCC GACTGATTGA CCTAATTCGT AGACAGCTTT 
AgCTAATGAT TCTACGAGTG CTTCTGTCGT ATTACCTTTT AATCCTAAGA ATTTGGCAAT 
ATCTGCATAA TCTGTATCTG CTCTGAAGAA CTCATATTTA GGGAATAATG CATGTTTTTG 
CGGGTCTTTG GCATTATAAC GGATAATATG CGGTAGTAAT ATCGCATTCG CTCTACCATG 
CGGAATACCA TATTCGCCAC CAATTTTATG CGCAATTGAG TGTGCAATGC CTAAGAATGC 
ATTTGCAAAT GCCATACCAG CCAAAGTTGA TGCGTTATGC ATTTTCTCTC TTGAAACTTT 
ATCACCCTTT TCAACAGATG ATTTTAAATA TTCGAACGTC AATTTAATCG CTTGTAGACT 
CAAACCTCTT GTGTAGTCTG AAGCCATTAC AGATACATAT GATTCCATTG CATGCGTTAG 
TACATCCATT CCTGTATCTG CTGTAACGCT TTTTGGCACA CTCATCACAA ATTGAGGGTC 
AATAATTGCA ACGTCAGGTG TTAAAGCAAA ATCAGCCAAC GGATATTTTA CATTTGTTTC 
ACTATCTGTG ATAACTGCAA ATGGTGTTAC TTCTGAACCT GTACCTGATG TCGTAGGGAT 
ACAAATGAAC GTGGCATTTT CAGGCATGCC TATTTTATAA GTACGTTTAC CGATGTCTAG 
GAACTTTTGT TTAGCACCGA AGAATGATGT CTCAGGGTGT TCAAAGAACA TCCACATTGC 
TTTTGCAGCA TCCATCGCTG AACCACCACC AAGTGCAATG ATTGTATCCG GTTGGAAATC 
AACCATCATT TCCAGACCTT TATATACTGT ATTAGTTGAT GGGTTCGGTT CGACTTCGCT 
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ATAACCGAAT. TCTACCATAC CAGGGTCACA GACAATCATC. ACTTTTTCAA TCTTGTCCAT 


X320 




TGTTGTTAGA CTCATGATTG CATTTTCTTC AAAATAAATT TGAGCAGGCA 


CCTTGAAAAi 


1330 


5 


TTGAGTATTA TTACGTCGTT TAGCAATCGT TTTAATGTTT AATAAATCTG 


TCGCACTAAC 


1440 




ATTATGTGAA ATTGAGTTTC TACCGTAGaA CCACAACCTA ATGTTAAAGA 


CGGAATCAAT 


1500 


10 


TCGTTATACA TATCACCAAT ACCTCCAACC GCTGATGGTG TATTTACAAG 


TACACGACAA 


1560 


GCTTTCATTC TTAGTCCAAA ATCTTTTTGT AATGTTTCAT CTTCTGTATG 


GATAACGGCT 


1620 




GTGTGTCCTA ATCCACCAAA ATGTAGTGTG TCTTCACAAA TTTGAAATGC 


TTGTTTTGTA 


1680 


IS 


GATTGGGCTT TTACTAAGGC TAATACTGGA GATAATTTTT CACGAGATAA 


CGGATAGTCT 


1740 




GAACCTACAC CGCTAATTTC GGCTATGATA AGTTTTGTAT* TTTOGGGGAC 


AGGTATACCT 


1800 




GCTAATTCAG CTATTTCAAC TGCAGATTTA CCGACAATAT CAGGCTTAAT 

, -. . _ • . • ' 


ACCTGTTTTT 


1860 


20 


TGTTCATTCA TAATTGCATT TTCTAAGCGT TGTAATTCAT CTTTTTTAAC 


AAAGTATGCT 


1920 




TOATGTGCTT TAAATTCATT AGTAACATCT TTATAAATTT CTTTATCAAT 


GACTACAACT 


1980 




TGTTCAGAAG CACAAATCAT ACCATTATCA AATGTTTTTG AACCAATGAT ATCATTTACT 


2040 


25 


GCACGTTTAA TGTGTGCTGT TTTTTCAATG TAAGACGGCA CGTTACCTGG 


TCCCACACCT 


2100 




AATGCCGGTT TGCCAGTTGA ATATGCAGAC TTAACCATGC CCGAACCACC 


TGTTGCTAGA 


2160 


30 


ACTAATGCAA TACCTTTGTG ATTCATTAAT TGTTTTGTTG CTTCGATAGA AGGCACTTCA 


2220 


ATCCACTGAA TAATATCTTT AGGTGCACCT GCCTTCATTG CCGCTTCTAA 


TACAACTTCT 


2280 




GCTGCACGCT TCGACGATTC TTGTGCACTT GGATGGAATG CAAAAATGAT 


TGGATTTCCT 


2340 


35 


GTCTTAATTG CAATCATCGC TTTAAAAATA GTTGTCGACG TAGGATTTGT 


TGTTGGCGTA 


2400 
2460 




ACACCACAAA TAACACCAAT TGGTTCCGCT ACAXAwrrA AX^Uiiiixu itiAiv^xxv^ 




CCAATAATCC CTACTGTCTT ATTGTCTTTT ATTGAATTCC ATATATATTC AGAAGCGTAT 


2520 


40 


AAATTTTTAA TCGCTTTATC TTCGTATATA CCTCTTCCAG TTTCTTCATG 


TGCTAATTTT 


2580 




GCTAGCACCA TATGTTGATC AACAGCTGCT AAGCTCaTTT GATGAACAAT ATGATCAATT 


2640 




TCTTCTTGTG ACTTTTTAGA TAATGCITCT AATGCTTTTT TCCCTTTGTC 


AGCTAGAGCA 


2700 


45 


TCAATCATAA TTGCCACTTC TTGTTCTTTC GATCCACGAT TTTCTTTTTC 


AGGTATAGTT 


2760 




AACATATACA ACCACTCCTT TATACTTTGT GAATTATTTC ACAAACATTA TAGTACATGT" 

• * 


2820 


50 


CTCTCAGGAT ATAAAGAAAA TTCTATACAA AAAAGTTTAA TTTCGAATAT 


TATTTGAACA 


2880 


AATATCAAAT TTTAAAATAA ATGTTTTCAT GAAATCATTG TTATTTCGGT GTTTTTAGAA 


2940 




TGATTTTATA ATCATAATTT TTTCAATGAC ATAATTTATT CATAATTATA 


TATTTAATTC 


3000 
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TCCTTGTCGA TACCTATCAA CAGATGTTAC AAATAAAAAC CaCCCOTGTG AACGGGTGGT 

TTGTTCTGCG gCTATAAGCC TTCCTTACTG GCCaGCCCTA AAAGGGCACT GACAAGTCAG 

CCAACTCCAC TACTATTCCA GCAATCCTAA AGGTTTACTC TT TT TTCT T T CTTTTTTTAT 

TTTTCTCTCC AGTGAAAGGA TCTAAATATT CTTCCATTGA AATTTCATCT GCAACGATAT 

CCTCTTGTAA TTGATTACGA ATATAATTTT CAATCACTTT TTTATTTCTA CCTACTGTAT 

CCACATAAAA TCCTTTACAC CAAAACTTTC TATTTCCATA TCTATACTTT AAGTTAGCAT 

GTCTATCAAA TATCATTAAA TTACTTTTCC TTTTAAATAG CCAACAAATG ATGATACCCC 

AAGTTTGGGT GGTATACTTA CTAACATATG GATATGATCT TTACATACCT CTGCTTCAAT 

TATCTCTACA CCTTTTCTTT CATATAATTG ACGTAATATA ATCCCTATAT CTTTTTTTAT 

TTTTCCATAr ATCGCTTGTC TTCTGTATTT AGGTGCAAAG ACAATATGTT ACTTACAATT 

CCATTTCGTA TGTGCTAAAC TGTTTGTGTC AGATGACATT AAATAGCATC TCCTCX3TGTT 

GATTATTTTG GTTGQCTOAC CAATATTTAC TCTAACATGT AQAGATGCAT TTTTTTGACA 

ATGGTAGAAC CTTTTCTGGG GAGTGGGACA GAAATGATAT TTTCGCAAAA TTTATTTCGC 

CGTCCCACCC CAACTTGCAT TGTCTGTAGA AATTGGGAAT CCAATTTCTC TTTGTTGGGG 

CCCCGCCCCA ACTCGCATTG CCTGTAGAAT TTCTTTTCGA AATTCTCTGT GTTGGGGCCC 

CTGACTaGAA TTGAAAAAAG CTTaTTaCAA GCGCATT 

(2) INFORMATION FOR SEQ ID NO: 224: 

(i) SEQUENCE CHARACTERISTICS: 

<A) LENGTH: 1391 base pairs 
(B) TYPE: nucleic acid 

<C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



3120 

3180 

3240 

3300 

3360 

3420 

3480 

3540 

3600 

3660 

3720 

3780 

3840 

3900 

3960 

3997 



40 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 224: 
GnGCGAGACA AACACACtTA TTGGTGCCAT TATmCcTAGA ATGaATTCaT ATGCAGTAGA 
TGAaaCAATC AAAGGATTGG CAAAACAATG CCAAAAATAT GAATCaCAAT TAATTTTAAA 
TTACACAGGT TTAAATATCG AAGCAGAAAT ACAAGCGCTT .GAAACATTAG CACGCaGTAA 
AGTAGATGGT ATTGTTTTAA TGGCTACAGA CATAACAGAG AGACATATTG. AAGTCATTAA 
TAAAATGAAT GTACCAATCG TTATTGTTGG TCAACAACAT GAACAACTTC ATAGTATTGT 
GCATGATGAT TATAAAGCAG GTCAAATTAT AGGCGAATGG ATTGGTCAAC AGGGATATCA 
ACAAGTTGAA GTGTTTAGTG TAAGTGAAAA AGATATTGCA GTTGGTATAC ATAGAAAACG 



60 
120 
180 
240 
300 
360 
420 
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TACTTATGTG 


GAAGCACAAA AAGATGTTGC AAATGTTTTG 


GAAAATGTGG 


AGCAAGTAGA 


. 540 




TGCGGTTGTT 


GGAGCAACTG 


ATACGATTGC ATTAGCTGCC 


TATAAATATT 


ATTCTGATAA 


€00 


9 


AAAAGATGTT 


ATGAAACCAC 


ATCAAATATA TGGTTTTGGT 


GGTGACCCAA 


TGACACAATT 


660 




AGTGTCTCCA 


TCGATAAAAA 


CAATTCATTA TAATTATTTT 


GAAGCTGGCC 


AATGCGCGAT 


720 


10 

.' 


GGaAGAGATA 


CAACAGATGC 


TTAAAAAGCA AGATATGCCA 


TATAGCGTCA 


CAGTAGATGT 


780 


TAATATTTAG 


ACGCTGTATT 


rriTAAAATA AATGTGGAAC 


CGATACCATA 


TAACTATAAA 


840 




TGGATAGGTT 


AAAAGTTAAA 


GAACGTAGGT AAAATTTGCT 


ATAATAGAAT 


ATAAATTGTT 


900 


IS 


AACAGCATAA 


ATTATAAAAG 


GAGGACTGGG TAAATATTAT 


GACCGAATGG 


ACTAGAGAAG 


960 


• 


' AACGTTATCA 


ACGAATCGAG 


GACGTTGATA CTGAGTATTT 


TAAAACATTA 


AAACAACAAG 


1020 




TTGATCAATC 


AAAATTTCGT 


CAACAATTTC ATATACAACC 


AGAAACAGGC 


TTATTAAATG 


1080 


20 


ACCCCAACGG 


ACTTATTTTT 


TATAAAGGGA AGTATTATGT 


TTCACATCAA 


TGGTTCCCAT 


1140 




TAGGCGCAGT 


ACATGGCTTA AAGTATTGGT ATAACTACAC 


GAGTGATGAC 


TTAATAAACT 


1200' 




TTAAAGCTGA AGGGCCAATT TTAAATCCAG ATACTAAATA 

• 


TGACAGCCAT 


GGTGTATATA 


1260 




GCGGTAGCGC 


TTTTGAATAT 


AACGGGCATT TATATTATAT 


GTACACAGGA 


AATCATCGAG 


1320 




ATAATCATTG 


GCAACGACAT 


GCGAGTACAG ATGATCGCAC 


GATTGAAAGA 


AGACGGTTnC 


1380 


30 


AGTTGGnAAA 


A 


• ' . * . ■ • * 




* 


1391 


(2) INFORMATION FOR SEQ ID NO: 225: 








35 


(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 930 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) 'T0P0UX3Y: linear 




• 




40 


* 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 225: 








ATTTAriTTA 


ATGTTTATAT 


TTTCTAACAC TTTTTTATGA 


TCATAGTAGT 


AATTGACATT 


60 




TTTCAATTCA AAGACTGGTG 


TCATCGTATC TCACCTCGCA 


TTCAACTATA 


CAACTCCTAG 


120 


45 


TAACATATGT 


AAACAGTAAT 


GTTTACGACT CAAAATTAGA 


CAAAATAAAG 


AGATATGCCC 


180 




CCTTCAAGTT 


TTATTTATCG 


CATTTCTTGA AGAGAGCATT 


ATCATTTTAT 


TGTTGCATAA 


.'240. 




CCTTATTTTT 


TAATTCTGGG 


TCAAATTGCT GTTGTTTTAA 


CATTTCAATT 


TCAAGTTTAT 


300 




ATGGCGGTTT 


TTTATTTTTC 


TTATCTTCAC CAACATAAGG 


TGTTTCTAAG 


ATTTTCGGAA 


360 


1 


TATCTTTAAA 


ACTATCATGA 


TGCACAATGT AATTTAATGC 


ATCAAAACCA 


ATGTAACCGA 


420 
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GAACAACTTT GATTCTGTCG ACTCCAATGA TTTTATCAAA TTCATTTAAT ACGCCATCAA 
AGTCCTCTTT AACATTATAT CCAGCATCAT GCGTATCACA XX5TATCAAAA CATACTGATA 
AACGTTCGTT ATTATGAACT . CCATCAATAA TACGTGCTAA CTCTTCAAAT GAGCGACCAA 
TCTCTGTACC TTTACCTGCC ATCGTTTCAA GCGCAATACG TACATTATTG TCATTCGTTA 
AAACTTCATT TAATCCTTCA ATAATCTTAT TAATTCCGGC AXCAACACCA GCTCCAACAT 
GCGCACCTGG ATGTAATACa ATATCTTTAG CCCCTATAGC XTGCGTTCTk TCaATTTCTT 
GTTGCAAGAA ATCTACACCA AGATTAAACG TTTCTGGTTT GGTTGTAttG CAATaTTSLAT 
GATGTATGGT GGCATGAACA ACAATATTAG 
(2) INFORMATION FOR SEQ ID NO: 226: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1934 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : doxible 

(D) TOPOLOGY: linear 



. (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 226: 



TGACGCACCA 


ATTTATAACG 


CAATTGACAA AACAATTAGA 


TATACCTGTG 


AAATTTGTAC 


CTGGAAACCA 


TGATTTATGG 


GAAGTTGAAA 


GTATGACTAC 


GCAAGACATT 


TGGAATAATT 


ATAAGAGTAT 


GTCACAGTGC 


TTGGTAGGAA 


AACCA'l-iTAT 


AGTAAATGAA 


GAATGGGCAA 


TCATAGGACA 


TACTGGCTGG 


TATGATTATA 


GCTTTGCAGC 


ACAACGATTT 


TCATTAGATG 


AGTTACAAAA 


AGGAAAACAT 


TATGGTGCGA 


CTTGGCAAGA 


TAAAGAACGA 


ATATCTTGGG 


GCATATCAGA 


TCAAAATTTA 


TCTAAAATAG 


CGGCTGAACA 


AGTGAAGAAA 


GATATATTAG 


AAGTAGGAAA 


TAGACGAGTG 


ATTTTAGTCA 


CACATGTTGT 


GACGCACCCT 


GATTTCATTG 


TTCCTATGCC 


GCATCGTATA 


TTCGATTXTT 


ATAATGCATT 


TATTGGGACA AGTGATTTCA 


ATCCTTTGTA 


TGCGATGTTC 


QATATACCAT 


ATAGTATTAT 


GGGCCATGTT 


CATTTTCGTA 


AAAGTGTGAT 


AGATGATGGC 


AGATGTTATC 


TCTGTCCGTG 


TCTAGGCTAT 


CCAAGACAAT 


GGCGTTCAGA 


AGATATTTAC 


CAGGAAATAA ATGAGACGAT 


ACAAATAATA 


GAAATTTAAA 


ATGCGCAAAC 


CTGACCCAGT 


TTGCGCATIT 


TATGTTTTAC 


ACACGCGAGT 


AATGTGTTTA 


CTTACGTGTG 


TTTATTTTGT 


TGCTGATTTT 


CAATTGTATA 


TGAATGTGGT 

• » ' * ■ 


TGCACATAAA 


TGCACTTTCT 


TCCTGGTGAA 


TTAAAGCTGT ATTCCAIITT 


CTCTTTACGA 


AITTTAATAA 


TTTGTTTGCG 


ATTTGGAATO 


ATGGCAGGTA AAACTAGGCC ACGACGAATA 


TGACTCCAAA 
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TTGAAACTTG TTTCGCTGGC TTGTTATCAA AGCGGAAAAC ACGTAGTAAT GGTTTAGAAC 
CAAGATTAGT ATGGTATATT AACACAGGTT GACCTTGATC GATAATACCT TTAAGATCTT 
CTAACXiATTT ACCAGTGCCG TCTACX5ATAT TAGGATTGTA TTTTTGTAAA AATGGTACAT 
ATGCTTCTGG AAATATCGTT TGATGATAAT TGCCAAGCTT AATGAATAAG TGATGTCCAA 
CATAACCTTT ATGTGGATTG TTCGGATGTG TCGGCCAATG TCTCATAATT TCTGTAGCAG 
GGATATGTTG GTTGTTGTAT TGCAACATGA TGGCTGCOOA AACACCTTCA CACCCCATGA 
CCATAGGGAT AGGAAATAGC XGACTGATAG GTTTAACTGG TAATATTTTT CGGTTCATAA 
TATAGTCCTC GCATTGATTC AATAAATATT TAATATAATT ATATAGCGTC AATGCAAAAT 
GTCCTAAACA TATGTTTTAC AT6AGTGAAT AAAATTAATG GAGTGATAAA ATGGAATATC 
AATTACAACA ACTTGCGTCG TTAACGTTAG TAGGTATTAA AGAAACGTAT GAAAATGGAC 
GACAGGCTCA GCAACATATA GCAGGGTTTT GGCAAAGATG TTATCAAGAG GGAGTAATTG 
CGGATTTACA GTTAAAAAAT AATGGT6ATT TAGCCGGGAT ACTTGGCTTA TGTATACCTG 
AATTAGACX3G TAAGATGTCA TATATGATTG CAGTTACCGG AGATAATAGT GCTGATATTG 
AAAAATATGA TGTCATAACA TTAGCAAGTT CAAAGTATAT GGTATTTGAA GCACAGGGCG 
CAGTACCTAA AGCAGTTCAA CAAAAAATGG AAGAGGTTCA TCACTACATA CATCAATATC 
AAGCAGATAC GGTAAAATCA GCACCATTTT rTGAGTrGTA TCAGGATGGT GATACTACAA 
GXGGAAAATT AAXATTACCA GAAATTTGGG ATnCCTGTTA AAGGGGTGAT TGAAATAnGA 
AnTG 

(2) INFORMATION FOR SEQ ID NO: 227: 

(i) SEQUENCE CHARACTERISTICS: ' 
(A) LENGTH: 6373 base pal 
r (B) TYPE: nucleic acid 

(C) STRANDEDNESS : dotible 
ID) TOPOLOGY: linear 



X020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 
1920 
1980 
1984 



45 



SO 



Ixi) SEQUENCE DESCRIPTION: SEQ ID NO: 227: 
GATTCCACGT GTGTTAAAAG AAGTTACAcC TTCAATGATG GTATTTACTA ATTTCTTTAG 
AGATCAAATG GATCGCTTCG GTGAAATTGA TATTATGGTT AATAACATTG CAGAGACAAT 
TAGTAATAAA GGCATCAAAT TATTGCTAAA TGCTGATGAT CCATTTGTGA GTCGTTTGAA 
AATCGCAAGT GATACGATTG TGTACTATGG TATGAAAGCA CATGCCCATG AATTTGAACA 
AAGTACGATG AATGAAAGTA GATATTGTCC AAACTGTGGT CGCTTATTGC AATACGATTA 



60 
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AAAATATGAA ATATCAAGTT TTGATGTGGC ACCGTTTTTA TATTTAAATA TCAATGATGA 
AAAATATGAT ATGAAAATTG CAGGTGACTT TAACGCTTAT AACGCGTTAC AGCATATACT 
GTTTTAAGAG AGCTAGGGTT AAATGAACAA ACAATTAAAA ATGGCTTTGA AACGTATACA 
TCAGACAATG GTCGTATGCA GTACTTTAAA AAAGAACGAA AAGAAGCGAT GATCAATTTA 
GCTAAAAATC CTGCAGGAAT GAATGCAAGT TTATCAGTTG GTGAACAATT AGAAGGCGAA 
AAAGTGTATG TTATTTCGCT AAATGATAAC GCTGCAGATG GTCGAGATAC TTCATGGATT 
TATGATGCAG ATTTTGAAAA ATTATCTAAG CAACAAATTG AAGCTATCAT CGTGACAGGT 
ACACGAGCAG AAGAACTTCA ATTGCGATTG AAGTTAGCAG AGGTTGAAGT ACCAATTATA 
GTTGAGCGTG ATATTTATAA AGCAACX3GCA AAGACTATGG ATTATAAAGG TTTCACAGXT 
GCAATACCAA ACTATACATC ATTAGCGCCT ATGCTTGAAC AATTAAACCG TTCGTTTGAA 
GGAGGTCAAT CATAATATGC ATGAATTGAC TATTTATCAT TTTATGTCAG ATAAATTGAA 
TTTATACAGT GATATAGGAA ATATTATTGC TTTAAGACAA CGTGCTAAAA AACGAAATAT 
TAAAGTTAAT GTCGTAGAAA TCAATGAAAC AGAAGGTATT. ACCTTTGATG AATGTGATAT* 
TTTCTTTATC GGTGGTGGAA GTGATAGAGA ACAAGCATTA GCAACAAAAG AATTAAGTAA 
AATTAAGACA CCACTTAAAG AAGCGATTGA AGATGGTATG CCGGGATTAA CGATTTGTGG 
AGGCTATCAA TTTTTAGGGA AAAAATATAT CACGCCTGAT GGTACAGAAT TAGAAGGGTT 
AGGTATTTTA GATTTTTATA CTGAATCAAA GACAAACCGA TTAACAGGAG ATATTGTTAT 
CGAAAGTGAT ACTTTTGGAA CTATTGTAGG TTTTGAAAAT CACGGTGGTA GAACATATCA 
TGATTTCGGT ACACTTGGTC ATGTTACTTT TGGTTATGGT AATAATGATG AAGATAAAAA 
AGAAGGCATT CATTATAAAA ATTTATTAGG TACTTATTTA CATGGACCAA TTTTACCTAA 
AAAfTACGAA ATCACTGATT ATCTGTTAGA AAAAGCTTGT GAACGTAAGG GTATTCCGTT 
TGAGCCTAAA GAAATAGATA ATGAAGCGGA AATACAAGCG AAACAAGTAT TAATAGACAG 
AGCAAATAGA CAGAAGAAAT CTCGTTAACT CTGAACATCG CATCAATGGA TTTAATATTG 
ATAAACGATG AAGTTTAGTA ATTAATCATA TATGTATAAA CACACACATT ATTTTGGATG 
GAAACAACCA AATTGATGTG TGTTTTtTTG TTCTAGTGAA TAATTATTAT ACAATGAGTA 
TCTATCCTAG AATTATCAAT AGTAATGGTG ATTATGCAAC ATGAAAAAAT GAATGATGAA 
AGGAATTTGA CGATGAAGCC TACTAAAGTG ATATTAAAAG ATGCATCTTA TTTACATAGC 
AAAACATCGA TAACATTTAT TTTAAAAGAT GTAGTTATCG AAGAAGATAA TAAAATTTAT 
TATTTCGACA CTAGTGCACT TTCGAAGATC AAGAAGTTAA ATTTGAATTT GCACTCTTTG 



420 
480 
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600 
660 
720 
780 
840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
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1920 
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2040 
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TTATAGAACC TGATTTACAT TTTACAATTA TTGATTTTAA TCAAGAACTG CTTTGTATTT 
ATATTGATTT TGATTCTGGT TTAAGGCATT CAAACATGGC AACAGAATCT GGTATTTCAT 
TAAGGATAAA TGTTGCTAAA TCAGATTTTA CTAAATTTAT TAATGAATTA GCCTCTTTAC 
ATTAATGATT TAAATCTGAT ATGTAATTAC AATCAAAAAA GACAGCCACA TCCCTCCGTA 
GTTTAGGCGT GTGGCTATAT TTGAGTCTGA ATATTTATGC TTGTAATTTT AAAAAGGGAC 
ATGCTATATA CGATAAAAAG AGGCGGGGAC ATAAATCAAT GTTCTATGCT CTACGAAGTT 
ATATTGGCAG TAfiTTGACTG AACGAAAATG CGCTTGTAAC AAGCTTTTTT CAATTCTAGT 
CAGGGGCCCC AACAAAGAGA AATTGGATTC CCAATTTCTA CAGACAATGC AAGTTGGGGT 
6TGGGCCCCA ACACAGAGAA TTTCGAAAAG AAATTCTACA GGCAAAGCGA GTTGGGGTGG 
GACGACGAAA TAAATTTTAT GAAAATATCA TTTCTGTCCC ACTCCCATGG TGCCAATTAG 
CATAAGGTAC rrAAATTAAG CATATCTGCT GTCTAGCAGT CGATAAATCA TTAGAACTTC 
GTATAGTATA TGACTTTTAA TTTGATTTTC ACCACTAATT TCAAGTGCTT TTATAGTCGA 
ACGTAAAGTT TCTACAGAAT CATCTTCTCT CTTAAAAGAA CCATCATAAA ATATATCTTT 
QATGCTACTA CTAATTTTTA GCAATGCCAT TTTTTCGTCA CCTGAAAAGT TAACACGAGT 
ATTTTTAGGC AAGTAAATGA TATTTGATAA ATGAGTGATA AACAAACGAT TCGTATATGC 
ACGTTTAGTT AATTGATTGA GTAATTTCCA ATCACATTCT TTTTTCTTAT GATAGCTTAA 
TTCATCACGT TGATAACTTA TTAACGTTTC AACTTGATTA TTTAAATTGA AAATATTTTT 
ATATGCTTTT TCGCTTTTAT CAGATTGCAG TCTTGATAAG ATAAGTTCTT GGCAGCGATT 
GTAAAATAAT TTATACATCA AGGCATCXGT CTTACTTAAT TTTTCTTCGA CCTGACCATA 
ATACTTAGGT GGAAACACCA TGAAGTTAAT TAAACCTGAT GTCACGAGTC CAATAATTGC 
TGTCMTGTT CGAGACAAAA AGTTGAATAT GTAGGCATCA TGAATACCTG GAATCATAGC 
TAATGATGTT AGTACAGCGA CATTCGTACC AACTTGCAAT TTGAGTTTTG TACAGAATAA 
AATCGTGAAC GTTGCACTCA ATGCATATGT AAAAGGTGAT TGATCGCCGA ATAAATATGT 
AAATAATACT GCAAAGCCTG CACCAATXAC CGTAGCAGGT AATCTACGAT AACCTTTAAT 
AAGTGATGCC TTGGCAGTTG GTTCAATTGT GACTACAGCT GTTAAAATGG CATAGATGGG 
TGTTAAATCT AGTGCCATAC AAAA6ACAGC TGTTAAAAAA ATGGCAATAC CAGTTTTAAT 

TGTTCTGGCA CCAATTAAAT GTTTATACCA TTGATCGTTC ATTTTTTAAC CTCTAATCAT 

... . • ' 

CGTAAAATCT TAGCGAGCGC TTTATAATAA TAGTATCGTA CAXTGGAAAA GTTCATGTAT 
GTAAAATATT TGAAATAATC ATACATAAGC ATTACTTTGA TTTTCATATA CATTAATCAA 
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CAAGCATTTT TCAATTATAG TCCGGGGCCC CAACATAGAG AATTTCAAAA AAGAAATTCT 
ACAGGCAATG CAGGTTGGCG GGGCCCCAAC ACAGAAGCTG ACGAAAAGTC AGCTTACgAT 
AATGTGCAGG TTGGCGGGGC CCCAACATAG AGAAATTGGA TCTACAATTT CTACAGGCAA 
TGCAAGTTGG GGTACAACGA TAAAGAAATA TTTTTTCTTT ATCACACTAT GTCTCACTCA 
CTTTCCAAAA TACTAAAGTA ACATCTTTAG TATATCAAAG AATTTTTGCT ATAATAAGTT 
ATAATTATAT AAAAAAGGAA CGGGATAAAA TGATTGTAAA AACAGAAGAA GAATTACAAG 
CGTTAAAAGA AATTGGATAC ATAXGCX5CTA AAGTGCX3CAA TACAATGCAA GCTGCAACCA 
AACCAGGTAT CACTACGAAA GAGCTTGATA ATATTGCGAA AGAGTTATTT GAAGAATACG 
GTGCTATTTC TGCGCCAATT CATGATGAAA ATTTTCCTGG TCAAACGTGT ATTAGTGTCA 
ATGAAGAGGT GGCACATGGG ATTCCAAGTA AGCGTGTCAT TCGTGAAGGA GATTTAGTAA 
ATATTGATGT ATCGGCTTTG AAGAATGGCT ATTATGCAGA TACAGGCATT TCATTTGTCG 
TTGGAGAATC AGAXGATCCA ATGAAACAAA AAGTATGTGA CGTAGCAACG ATGGCATTTG 
AGAAXGCAAT TGCAAAAGTA AAACCGGGTA CTAAGTTAAG TAAGATTGGT AAAGCGGTGC 
ATAATACAGC TAGACAAAAT GATTTGAAAG TCATTAAAAA CTTAACAGGT CATGGTGTTG 
GTTTATCATT ACATGAAGCA CCAGCACATG TACTTAATTA CTrTGATCCA AAAGACAAAA 
CATTATTAAC TGAAGGTATG GTATTAGCTA TTGAACCGTT TATCTCATCA AATGCATCAT 
TTGTTACAGA AGGTAAAAAT GAATGGGCTT TTGAAACGAG CGATAAAAGT TTTGTTGCTC 
AAATTGAGCA TACGGTTATC GTGACTAAGG ATGGTCCGAT TTTAACGACA AAGATTGAAG 
AAGAATAGTT CAACATATAC TAAGACTAAA GTATGAACAT CATTTAGTTC CGGAGCCTAT 
TCATATTGGT TTCGGAACTG TTTTATAATA ATTAAGAACA CAATCAATGC GTCATTTCAA 
AAATATGTTG TAACAAAGTA GTTTTTAAGC AAACATATCA TCGACATCAA CGAAGATACA 
TAGCGCATTT GGTATTTTAA AACTTATTAT AAAAGGTGAT AGTTATGAAC TATGTTGAAC 
GTTATATTGA ACAGTTTTTG AGAGCAACAG TAAGAAATAA TATCAAGCAC TACCTTTTAA 
TGCTAGATGA AAAAATGAAA AATTTAGATG ATTATATGCG TTATTTAATT ACTAAAAAAG 
AACAACTTAG CAAGTTAATT GACAGTCTAA TGCTAACATT AGAAAATAAA TATATTGATA 
TTGCTGAAGC ATTTCAAATT CAATGTGCAA GAGAAATCAA TAATCAAGAA ATTGAAAATA 
TTAAATCAGA GTTGAATAAA GTTGAAGCAT ATTATGCAGA AATTGAAACT CAAATTCAAC 
AAACTTCAAC TGAAAAAATA GCAACAGAAA AAACATCGTA TCTAATAAAT TATATGAACG 
CTGTGGCATA GAAAGGCGGC GAAACATGAC ACACAAATAT ATATCAACGC AAATGTTGAT 
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CTTTTTACTC GTTCTATTAT TGGGATXJTGT ATTAGTTTAT GTAGGATATC TTTATTTTCA 
TAAAATACGT GGCCTTTTGG CGTTTTGGAT AGGCGCGCTA TTAATTGCAT TCACATTATT 
GTCTAATAAG TATACAATCA TCATCTTGTT CGTCTTTTTA TTATTACTTA TTGTGCGTTA 
TTTAATACAC AAGTTTAAAC CAAAAAAAGT AGTTGCGACG GATGAGGTTA TGACTTCACC 
ATCTTTTATT AAACAAAAGT GGTTTGGTGA GCAACGTACA CCAGTTTATG TATATAAGTG 
GGAAGATGTA CAAATTCAAC ATGGAATTGG CGACCTACAT ATTGACTTAA CAAAAGCTGC 
AAATATTAAG GAAAATAATA CCATTGTTGT TAGACACATT TTAGGTAAAG TGCAGGTTAT 
ATTGCCGGTT AATTACAATA TTAATTTACA TGTAGCTGCT TTTTATGGAA GTACTTACGT 
GAATGAAAAA TCATATAAAG TTGAAAATAA CAATATTCAT ATTGAAGAAA TGATGAAACC 
GGATAACTAT ACAGTTAATA TCTACGTATC AACGTTTATC GGAGACGTAG AGGTGATTyA 
TCGATGAAyC ACT 

(2) INFORMATION FOR SEQ ID NO; 228: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4488 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDMESS : double 

(D) TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 228: 
ATAGnGAAAG CGTTTTACAC TTAATAACTC CCTCTTAAAT GCATCCAGGT TCTATGTAGT 
AAATCATGAA IlATAACATAT AAATnTAGAG GAGATTTACC TTTGAATACA GAGAACAACA 
AGAATCAAAA CCAATCTGTT AAAAATTCTG AAAGaCGCGG CATGTTAAAA GGATGCGGCG 
GTTGCCTTAT TTCTTTTATT TTATTAATAA TCTTATTATC AGCCTGTTCA ATGATGTTTA 
GTAATAATGA CAATTCCACT AATAATCAAT CATCAAAAAC GCAATTAACT CAAAAAGATG 
AAAATAAAAA TGAAGATAAG CCTGAGGAAA AATCAGAAAC AGCAACAGAT GAGGATTTAC 
AATCAACCGA AGAAGTACCT GCAAATGAAA ATACTGAAAA TAATCAACAT GAAATTGATG 
AAATAACAAC AAAAGATCAA TCAGACGATG ATATTAACAC ACCAAACGTT GCAGAAGATA 
AATCACAAGA CGACTTGAAA GATGATTTAA AAGAAAAGCA ACAATCAAGT AACCATCATC 
AATCCACGCA ACCTAAGACC TCACCATCAA CTGAAACAAA CACGCAACAA TCATTTGCTA 
ATTGTAAGCA ACTTAGACAA GTATATCCGA ATGGTGTCAC TGCCGATCAT CCAGCATATC 
GACCACATTT AGATAGAGAT AAAGATAAAC GTGCATCTGA ACCTGATAAA TATTAAACAA 



60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
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GGGAGATTTT TTAGGCATGA GCAATCAATT CAAAAGCGAA GAAGAGCGAA GACAATGGGA 840 

ACAATTCCAA GCTTTCCAAA ATCAACAAAA CCAACAGAAC CAGCAATACG GACAAAAGAA 900 

ATCTAAAAAA GGATGGTTCT GGGGCTGTGG TGGTTGTCTA GTATTATTTA TTTTAATTAT 960 

CATCGGTATT TCAGCTTGTA CAGCTGGTAT TACAGGTAAC CTTGGCXK3AA ATAGTTCTAA 1020 

AGAAACGAAC AAAACCCATA AAATCGGTGa AACTGTTAAA AATGGCGACC TTGAAGTCAC 1030 

TGTAAATTCA GTGGAAACTA TGAAATCTGT AGGACCATCT CTTGCACCAA CAAACX5CTAA 114 Q 

AGGTATATTT GXCGTTGCTG ATGTGACGAT TAAAAACAAA GGTAAAGAAG CGTTAACAAT 1200 

TGATAGTTCA ATGTTTAAGC TAAAATCCGQ TGATAAAACA TTTGAAGCAG ATAATACAGG 1260 

TTCAATGTCT GCTAATCAAA GTGACAATGG TAGTATAGAA AATTCATTTT TCTTACAGCG 1320 

TATAAATCCA GATAGCACTG CTCAAGGTAA AATTGTTTcG ATGTGTCAGA AAACATAGCC 1380 

20 AACGCAAAaG ATAAAAAATT AGAAGTTATT TCTAGTTTAT TTAGCGTCAA GAAGATTACA 1440 

TTTGATTTAT CCGATGCTAA AAAAACATCA AAAGCTAAAA AAGACAAGCA AGATACAGAA 1500 

GTAGCTGTTG CGAGTTCAAA TAGCGATAAT GTAAGTTATG AAGCTTCGGC TACTACACCT 1560 

GcTACAACTT CTAGTGCGGA TACTGATTCT GAAGATAGCG AAAAGTCTAG TAAAGATGAG 1620 

GATAAGCAGA ATGCGTCTAA AAgTGATAAA TCTAGTGTAG AAAAAAGTGA ATCTAATGAG 1680 
GAAACTGCTC CTGTAGAGCC CATGCCCCAT AGCAAACCTA CCACTAGTGA aGCACCACCT ' 1740 

AGCCAAAATA TTCACAaTGa AGATAGCmTG TACGACGCTT CAACAGAATA AAATtnyCAG 1800 

tAGCTCGGCT ACCCTTCTTT TACGGAAAAA TTAATTATAC ATAATCaAAT CaAGGAGATA 1860 

AAAAAATGAA ATTCAAAGCT ATCGTTGCAA TCACATTATC aTTGTCACTA TTAACTGCCT 1920 

GTGGTGCTAA TCAACATAAA GAAAATAGTA GTAAATCAAA TGACACTAAT AAAAAGACGC 1980 

AACAAACTGA CAACACTACA CAGTCAAATA CAGAAAAGCA AATGACACCA CAAGAAGCCG 2040 

40 AAGATATAGT TCGAAACGAT TACAAAGCAA GAGGCGTTAA TGAATATCAA ACATTAAATT 2100 

ATAAAACAAA TCTTGAACGA AGCAATGAAC AXGAATATTA TGTTGAACAT CTAGTCCGCG 2160 

ATGCAGTTGG CACACCATTA AAACGTTGTG CTATTGTTAA TCGACACAAT GGCACAATTA 2220 

TTAATATTTT TGATGATATG TCAGAAAAAG ACAAAGAAGA ATTTGAAGCA TTTAAAAAGA 2280 

GAAGCCCTAA ATACAATCCA GGTATGAACA ATCATGATGA AACAGATGGT GAGTCAGAAG 2340 

ACATTCAACA TCATGACATT GATAATAACA AAGCAATTCA AAATGACATA CCAGATCAAA 2400 

AAGTCGACGA TAAAAATGAT AAAAATGCTG TTAATAAAGA AGAAAAACAT GATAATGGGG 2460 

CAAATAATTC TGAAGAAACT AAAGTTAAAT AATGGCATAC TTTGATTAAT CGTAATTTTT 2520 
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ACTATGCATG GTCTTTTTAA TCAACTTAAA CTCGGCATTA TTTCAATCGA AAACGCAGAG 2640 

CATACGCTTT TTACACCTTA TATGTTGGAA ACGCTCTCTT CCCTAGGCGT GAAAGACAGC 2700 

ATTGTCGATT TAATTCATAA AGGGACTGAA TTAGAAGACT TTGCGGCATT TAATTTATCA 2760 

ATTGAAGACA CAGTTACAGT CTGTTTACAA AGAACTGAAG AACTATTAAA ACAATACAAA 2820 

AATGTGGAAT TCAATGACAA AATATTAATC AATTGGCGTA TTATACAAGA GAAATAGACA 2880 

. TATAAAAGTC GAATGTAACt ACGTGAGTAT TGATTTTATT CTTTGTAAAT TACAAGCATT 2540 

TCATATTATA AAGTTTGAAA AGAGGTATAT TGAAATGGAG AAAAATGAAT ATATAGCTAA 3000 

,5 ATATAATGAA TATAGTCAAT TATTAGACGC TACATACTCG CAAGCTGTAG CATmCCTTTT 3060 

AAGtAAATaT GGCGCTGTAA CCGATGATTA TTATAAAGaA AAATCATACA CGCGATTTTT 3120 

AAAtGGAGnA ATCAAAAGTA TTTCAAAAGG AAAATACACT AGAGCTAGCG AaGGATTATA 3180 

20 TTGCCATCAT ATAAGCGAGG ACAAATTCCA AWITCTATCT . GATCTAAGAT TCATtTCCAA 3240 

ATTTAAGTAC TCATACGACG TTCAAAAGAA AGAAAACTTA GTGTACTGTG ATCTAATCGA 3300 

* * 

GCATTTAATT TTACATGCAA TTATTACAAA AGAATCCCAT GGCCAATTTG GTGTAGCTGG 3360 

ATTATGTCAA ATGATCAAAC CAACAGTCAT TGATTGGTAC ATTGGCGAAT ATAATCCAAA 3420 

ACCAGCATGG ATGCAAGCCA CCAAAGCACG TGCCTATTTG CCTGGAATAT TAGTAGAGAA 3480 

ATTACTCATT AAAATTGACG ATATGTTAAA AGGAATAGAA ATATAAGATT TCCTTGAGTC 3540 

TAGATAAATG ATTAATGTAG ATTTATTTTT TGCTGTTGAG ATTTTGTTAT AGATGTTTAA 36O0 

ACCTGTAATT AAATATATTT TATAAAATAG ACCACGCATA CCTATCTATA AACGGrCAAT 3660 

j5 GTTTATAAAT GAGTTTGCAT GGtCTTGAAT TGTATTAAAT TTCTTTTGGT TTTAATAAAT 3720 

CGACTAGATT TTCACAATAT TTATCAAATA TGTATTCCTA AATTATACAG CCTTAATCCA 3780 

GCACJCTACTT TCGAAACTTC CAACTTAGTT GATATAAGGT TCAATAGTTT GTTTCGTTCT 3840 

40 TTTrCAGPiTA AACCAGAACT TAAATTGATA TTATTGACTT CATAAAAATT ATAGACTAAT 3 900 

GCCTCTATTT GCTTTTTAGG CATAAGTAAG TCGACTGAAA ACTGATTTAC GTCGCTTTCA 3 960 

TAAATCATTT CATGTAAATT CTTTAGACTA TTATCGTTAC TATCTCTCAT TAAGTCTGTA 4020 

TTTTTAAATA AATAACGGCC CAATTCACGA GCTATTGAAA ATCTTGTATT ATTAATCGAG 4080 

TGATTATTAT TAATATAGAT TGTTCTTCCA CTTAAATAAC CCGAAGTATT ACCCTCCATT 4140 

TTAATATATC TAACATTTAA ATTAAGTTGA AATAATAGCT TGTCTATGTC AATAGCAAAG 4200 

TGTTCAGAAG TAATAAAAAG TTGATCCATT TTGTCCTTTA TAAATGCCTG AAATAATCGA 4260 

ACTATTTTTG ATTCTAAAAT ATCTTCATAA TGAACTTTCT CAATAACTTT CAATTGATTC 4320 
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AACATTATTA AAATAAAACC CCTCTACTAC TATATGTAAC GAAGGGACAT GATTTCAAAA 
TAAAATACCT TTTTTATAAA TnTATTATAA TATCCCCCAC TATACnAC 
(2) INFORMATION FOR SEQ ID NO: 229: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 846 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(0) TOPOLOGY: linear 

(Xi) SEQUENCE DESCRIPTIC»?: SEQ ID NO: 229: 
TATGGCGCCA TATTAGTTGT AACTGGTTTA AGAGGTCcAa GAAaTATCaA ATAAAGTTGT 
tCCTGGGCTT GGTACTGTTA TCTCaATATT GmwTGCaTTT GGTGGTCTAG CTTTTAATAT 
TGGTAATATT GCTGGTGCCG GTTTAGGTTT AAATGCAATT TTTGGATTAG ATGTAAAATG 
GGGCGCAGCT ATTACTGCAA TCTTTGCAAT ATTAATCTTT GTAAGTAAAA GTGGCCAAAA 
AATTATGGAC GTTGTTTCAA TGATTCTTGG TATTGTGATG ATTTTAGTTG TGGCATATGT 
GATGTTTGTT TCTAATCCAC CTTATGGTGA TGCTTTTGTG CATACATTTG CGCCAGAACA 
TCCAATGAAA TTAGTCTTGC CCATCATTAC GTTAGTTGGT GGAAcTGTar GTGGTTATAT 
TACCTTTGCA GGTGCACATC GTATATTAGA CTCTGGCATT AAAGGTAAGC AATATTTACC 
ATTTGTAAAT CAATCAGCAA TTGCTGGTAT TTTAACTACA GGTATTATGA GAACGTTACT 
ATTCCTAGCG GTATTAGGAG TTGTTGTAAC AGGTGTGACA CTAAGTTCTG AAAATCCACC 
AGCGTCAGTT TTTGAACACG CAATTGGACC AATTGGAAAG AATATTTTTG GTATTGTGTT 

atttgctgca gctatgtcat cagtaattgg ctcagcatac acaagcgcaa catttttaaa 
aao^Sttcat aaatcactta acgaaagaag taatttaatt gtgattgtgt ttatcgttat 

* 

ttcaacaatg attttcttat ttattggaaa accaatcagc cttitaatta tagcaggcgc 
gataaa 

(2) information for seq id no: 23 0: 

(i) sequence characteristics: 

(A) LENGTH: 2072 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

(Xl) SEQUENCE DESCRIPTION: SEQ ID NO: 230: 
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TCTTTTTAAA AGGTACTAAT ATTTCTTrAG TGAAAATTGA ATCACGGTCG TTTATTGGTG 120 

CCTTGAGTAT ATTATTATAG ACGGAATCTG ATCTAATAAT ATTGATTTTA TACATGATAA 180 

ACCTCCTTAT GTTGTCAGCA TAAAGGATAA CGTAACGTGA TTTTCAAGCA GTAATTGTAA 240 

CTAATTGAmA AAAATTAAGA AAAGTATGTG AGTGTTCCTA AwTAATATGa TTAAAATGAT 300 

GGCX3AATAAG TGTCTaAAAG CATCTTAAAG GGACATTGTA TAGGGTAAAT CACTTCATAA 360 

ATAAGGGaAA ATCCTTATGT TCACTTTTTC ACAATCATnA .TAAAATATAT. ATGTAGTCAA 420 

TACITTGTCT ATATTGAATG TTTTCATATA AATGAAAGCA TTTTTAAATA ACATTGACCT 480 

CTAATATATA GGCAGAGTAT TGATATCTAT TAAAAAATAA ATGATTTTGA TGAAGGTGAA 540 

ACGTATGTAC AAAACAAAAG GTGGCTTTCA ACTTACATTA CAAACATTAA GTTTAGTGGT 600 

TGGGTTTATG 6CTTGGAGTA TAATTGCGCC ATTAATGCCC TTTATTAAAC AAGATGTCAA 660 

20 TGTTACTGAA GGTCAAATAT CAATCATTTT AGCGATACCA GTTATTTTGG GATCGGTGCT 720 

CCGTGTGCCA TTTGGTTATT TAACAAACAT TGTTGGCGCT AAATGGGTAT TCTTTACTAG 780 

TTTTATCGTA TTGTTATTCC CGATATTTTT CTTAAGCCAA GCACAAACAC CGGGTATGTT 840 

AATGGCTTCA GGATTTTTCC TTGGTGTAGG TGGTGCAATT TTCTCAGTTG GTGTTACATC 900 

AGTTCCTAAA TATTTCCCTA AAGAAftAAGT AGGTCTAGCA AATGGTATTT ATGGTATGGG 960 

AAATATCGGT ACAGCAGTTT CTTCATTTTT AGCACCACCG ATAGCGGGTA TTATTGGTTG 1020 

GCAAACAACA GTTAGAAGTT ACTTAATTAT TATCGCTTTA TTTGCATTAA TTATGTTCAT 1080 

TTTTGGTGAC ACACAAGAAC GTAAAATTAA AGTACCATTA ATGGCtCAAA TGAAAmCATT . 1140 

ATCTAAAAAC TACAAATTAT ATTACTTAAG TTATTGGTAT TTTATTACTT TTGGTGCTTT 1200 

TGTAGCATTT GGTATTTTCT TACCTAACTA CTTAGTAAAT CATTTTGGAA TTGACAAAGT 1260 

AGATSCTGGT ATTCGATCAG GTGTATTCAT TGCGCTGGCA ACATTCTTAA GACCAATAGG 1320 

40 TGGCATTTTA GGTGATAAAT TTAATGCAGT TAAAGTATTG ATGATTGATT TTGTTGTTAT 1380 

'GATTATCGGT GCCATTATTT TAGGTATTTC AGACCATATC GCATTATTCA CTGTAGGCTG 1440 

TTTAACAATA AGTATTTGTG CAGGTATTGG TAACGGCTTA ATCTTCAAAT TAGTACCATC 1500 

ATACTTCTTA AATGAAGCGG GATCCGCAAA TGGTATCGTA TCAATGATGG GTGGTTTAGG 1560 

AGGATTCTTC CCACCACTAG TAATCACGTA CGTAGCTAAT TTAACAGGAT CAAGTCATTT 1620 

AGCATTTATT TTCTTAGCGG TATTnGGAnG TATTGCATTA TTTACCATGC GTCATTTATA 1680 

CCAAAAAGAA TATGGCTCAT TGAAaAACGG TTGATATGTA ATACATGCCA TTcATTTAGT 1740 

TAAATACAAA GCCTTaATAT CATGCGCAAT ATTCGTAGCA TGACATTAAG GCTTTAGTAG 1800 
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CTTGGTTTGA TTTTAGGCAA GGTAATGGTT AATAACCCAT TTTCAAAACT AGCAGTAATA 192 0 

TGTTGCTTAT CAACAGCTTC AAAATCAAAT TGACGCATTA ATGATTCGAA GTTACGCTCA 1980 

TCTAAAATGA GTTGTTCAGA TTTGTATTTT GCGCTTCTAG TAGCTTGAAT AGTGAGCGwA 2040 

TTAttATTGA AATCgATACT AATAtCTccC TG 2072 



(2) INFORMATION FOR SEQ ID NO: 231: 

TO 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3159 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : doilble 

(D) TOPOLOGY: linear 

15 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 231: 
20 CGTCTTCTCT TGGTTATTCT CTGTGTTTTG TCTTTGTTCA AATTCGATTT TTTGTTGTTC 60 

GAATGAATGT AATACTTTAT TTTTTTTTGG CACATAATCC AAGTnATTTT TAGGAATTAA 120 
TATACGGTCT TTAAATGCTT CTTGTATTTT GCTCACAATC AATTGGTATA GTTGCTCTTC .180 

25 

TTTTGATAAA CGCACTTCTA GTTTTGTTGG ATGAACATTT ACGTCTACTA AGATTGGATC 240 

CATTTCAATA TTAATATAAC AAATCGGGAA CCTACCTATT GTTAAGAGTG TATGATAGCC 300 

TTCTAAAATC GCTTTATTTA GCATAAAGTT TTTAATGTAT CGTCCATTAA TAAAAATAGA 360 

30 

AATATAGTGC TTATTACTTC TAGAATGTTC AGGCTTTGCA ACAAAACCTT CAATGTGATA 420 

ATCACTTGTA TCTCCAGATA TATGTACTAA ATCTCGTGCA ACTTTCATCC CATAAATCTC 480 

TGCCATCACT TCATTAGTTC GTCCTGAACC ATTTGTACTT AACATTGTTT TGCCATCTGA 540 

AATGAGTGCT ATTCGAATGT CCGGATGGCT CATTGCCATT CTGTTGACAA TATCTGTTAT * 600 

TTTACCTAGT TCAGTGTATA AACTTTTAAT ATATTTTAAA CGTGCTGGTG TATTATAAAA 660 

40 TAATGATTCT ACAAGTATAT CTGTTCCTTT TTTCGCTTTT GCAGGCTTAT GATTTAATAT 720 

TTCACCATTT TCTACATATA TTTCATTTCC ATTAGCATTA TCCGTGCAAG TCTTCAATGT 780 

TACTTTAGCA ACTGATGAAA TACTGGCTAG TGCTTCACCA CGGAATCCTA ATGTCCTAAT 840 

4S ■ 

ATGAAATAAA TCTTCATCTT GATCTAATTT ACTAGTCGCA TGTCTATGAA ATACTAATCC 900 

TAAGTCTTCC GCTTCAATTC CGCTTCCATT ATCGACTACG CGAATAGATT GGACGCCAGA 960 

tTCCTCTACT TCAATGCTTA TTTCTGTAGC GCCTGCATCT ATAGCATTTT CCAACAGTTC 1020 

SO 

TTTCACAACA GAACTCGGTC TTTCAACTAC TTCACCTGCT GCGATTTTAT TTGCTAATGA 1080 

GGTTTGGAGT TCTTTAATTT TCCCCATTTT GCAACACCTC TATTTTAATT GATTTTGTAA 1140 
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XTGTAGTTCA ATCTCGCTTT TTTGATCATT TTCAAACAAA TcAAATGATG CyTGTTCAAA 12 SO 

GTCTTTTTGA GATAAAGTAT CaGTTGTTTC TTCaACACTT aAGTTTAAAT TTTCTTGATT 1320 

AATTTCCAGG TTCATTTTCG ACCATTTTTA AATTTGATAT CGATGATtTT TCACCAGCAG 1380 

ACGCTTCAAA CTCGCTTAGA ATCACTTGTG CTCTGCTAAT AACTTTTTCA GGTAAATCAG 1440 

CTAATTTCGC AACTTGAATA CCATAAtATC GTCAACTGCA CCATCTTTGA CTTTATGCAA 1500 

GAATATAAGT TCACCTTTAT ATTCATTAGC AGCGACGTGA ACATTTTTTA GACTTGGTAA 1560 

TGCTTGATCr AATGTTGTCA ATTCATGATA ATGTGTTGAA AATAACGTTT TAGCATGTGA 1620 

TGTTTCAGCT ACATACTCTA TCATTGCCTG CGCTAAAGCT AAACCGTCAT ACGTTGAAGT 1680 

ACCACGTCCA ATTTCATCGA AAATAATCAA ACTATCCTCT GTTGCATAAG TTAATGCCTT 1740 

TTGTGCTTCT AGCATTTCTA CCATAAACGT ACTCTTACCT GAAACCAAAT CATCTGCCGC 1800 

20 ACCTATTCTA GTGAATATTT GATCAAATAT AGGTAACACT GCCTCTTTAC AAGGGACATA 1860 

AGCTCCCATT TGGGCCATTA TACTAATTAT GGCAACTTGT CTCATATATG TCGATTTACC 1920 

AGACATATTC GGACCTGTAA TTAAATATAT AAATGTTTCA TTATCTAATC GACAATTATT 1980 

AGGCACATAG TCATTATAAT CCATTACTCT TTCCACTACT GGGTGCCTAG ATTCCACTAA 2040 

TTCTAATGTT TTATTTTCAC TAAATGAAGG CCTAGTGTAA TTATATTTTT GAGCAATTTC 2100 

TGCAAAGCTC TGTAAACAAT CTAGCTCTGA AATAATTTTA GCTTGTTGTT GTAAACGTTC 2160 

AGTATATTTT TTAACTTCTT CACGTAGCTG AACAAATAAT TGATATTCTA ATTCGATGGC 2220 

TTTGTCTTCC GCACCTAAAA TGATATCTTC TTTTTCTTTA AGTTCATCAG TTATAAAACG 2280 

TTCAGCATTC GATAACGTTT GCTTCCTCAT ATAACCAAAT TCACTTGGTT CAAAATTTTG 2340 

CAAGTTGGCA CXrrGTTATTT CTATAAAATA ACCAAACACT TTATTAAAGC TTATTTTCAA 2400 

TGATilTATT CCTGTACGTT GTCTTTCTTT GGCTTGTAAT TCTGCTAACC ATGTTTTTCC 2460 

40 GTTTTTTGAA GCTTCAAGAT ATTCATCTAA TTGCGTATTA AAACCAACTT TGAATAGTCC 2520 

• GCCATCTTTA ACTGAAATTG GTGGTTCTTC TACTAAACTC TGTTCTAATA TATCAAGTAA 2580 

ATCATCaAGG GGTTCTAGTT GATTAACTTG TACAAGAGTA TTCTGATTCA TAGAATTTAG 2640 
TAATGCTTTA ATATTCGGTA TTTCAGAAAT GGAATGTTTA AGTTGAATTA AATCTCTCGC . 2700 

ATTAACATTT CCGTAACTAA CACGCCCAAC AAGACGTTCA ATATCATACA CTTGATTAAG 2760 

ATATGTTCTT AAGGTGTCTC TTTCTATGAA ATGAGCACTA AATTCATCAA CGATATCTAA 2820 

TCGTGCTTCA ATTTGTTCTT TACTTATTAG TGGTCTATCT ATCCATTGTT TTAAGCGGCG 2880 

TGCTCCCATT GGTGTTTTCG TTTCGTCCAT TAGCCAAAGT AGCGTTCCTT TTTTTGATTT 2940 
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ATCTATAGCT GCATATTGAA CAACATCCTC GATATGCGAT AAATCACGTT TTTGTGTATG 

ATGAATATAA TCTAGCAATA ATTGTGTCGC TTGATACaTT AATTTATGTT CAGTTTGATT 

CACACTATAG ATTtCTGATG ATAACGTTTC CCTGACTGT 

(2) INFORMATION FOR SEQ ID NO: 232: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1238 base pairs 
<B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi] SEQUENCE DESCRIPTION: SEQ ID NO: 232: 
TAAGCGAGAA GCAATTGGTG TTATGTATGC TAGTGATAAA CCAACAGGTG AAAGTACAAG 

gtcatttgct gtttatttct ctcctgaaat taagaaattt attgcagata atttagataa 
ataaatcatc catccataca ttgataaatg attttyagaa attaacaaca aaatcaacaa 
ttttaaacat ctctgtgatt ctatttattc gaaatgattt aaaaaataaa acttcaaaaa . 
cctaacctta tatttatacg aatacttaga ggagcacaaa aatgaataaa aatataatca 
tcaaaagtat tgcagcattg acgattttaa catcagtgac tggcgtcggc ao^acagtgg 
ttgagggtat tcaacaaacg gctaaagctg aacataatgt gaaactaatc aaaaatacta 
atgtagcacc atacaatggt gtcgtttcga taggatctgg aacaggtttc attgtcggta 
aaaatacaat tgttaccaac aagcatgtcg ttgcaggtat ggaaattggt gcacatatta 
tagcgcatcc caatggtgaa tataataatg gcggatttta taaagttaaa aaaattgtcc 
gttattcagg tcaaqaagat attgccattc tacatgtgga agataaagct gttcatccaa 
AAAACAGGAA ttttaaagat tacacaggca ttttaaaaat agcatcagaa gctaaagaaa 
atgaacgcat ttcaattgtt ggctatccag aaccatatat aaataaattt caaatgtatg 
agtcaacagg aaaagtgctg tcagttaaag gcaacatgat tattactgat gctttcgtag 

AACCAGGCAA CTCAGGTTCA GCTGTATTTA ACAGTAAATA CGAaGTtGTA GGTGTTCACT 

ttggtggaaa cggccctgga aataaaagta caaaaggata tggtgtttat ttctctcctg 

AAATTAAGAA ATTCATTGCA GATAACACAG ATAAATAAAT CCTTACATAG ATAAATGATT 
TTAAAAATTA ACAACAAACT CAACaATTCA AATCATCTCT GTGATTCCAT TTATTCGAAA 
TGATTAAAAA AAATAAAACT TCAAAAAGCT AACATTATAA TTATACAAAT ACTTAGAGGA 
GCAGAAAAAT GaATAAAAAT ATAATCATCA AAAGTATTGC AGCATTGGAC GATTTTTAAC 
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(2) INFORMATION FOR SEQ ID NO: 233: 
(i) SEQUENCE CHARACTERISTICS: 

5 (A) LENGTH: 6444 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

10 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 233: 

TGATAAGTCA TTTAAATTGT CACCTATTGA CATGACTTCT TTCATTTCAA TCCCTAATCT 60 
15 TTCGGCAATT GTTTCTAGCG CAATACCTTT TTGTGCATCT GAATGCGTTA TTTCTATATT 120 

TCCTCTCGAA GATGATGATA TAGCTAAATT CGGAGAJcTCA GCTAAAATTT TACTAGCTTT 180 

GTCAATTTTT TCTAAATTTC CATCAAATGC TAATATTTTC ATAATTAATT CACCAGGTAT 240 
20 GTTTTCAATA GCATCATAAT TATCAACAAC TyTCAACGTA CCATTATCTA TGCGTCTTTG - 300 

AATACCATTT TTAATACGCT CAACGTTTGC ATGTTGACCT GCACGCTCAG CAATATCTAT 360 

GTAAATGTCT AAATCTCTTT GTGGATCTTC AGTATAAATC GCACGACTCG TGTATACTTG 420 

25 

ATAATAAATA CCTGCATCTT TTAAAACATT TGTAATTTTG TGTACTAACG ATTTATTAAG 480 

GTGTGAAGTG CTCATTACAT TGAAAGTTTC ATCACGTACT TCAGCACCAT TCAAACAAAT 540 

ATATGGTACT GTTAAATCTG TGTCAGCAAC TGGTGCTTGk GCTTCATAAA ATGCTCGACC 600 

30 

TGTCGCGATA ACAACCGTTA TCCCTTGTTC TTGAGCGTAT TTAATCGCAT CAATATTAGG 660 

TTGAGAAATT TCATGTGCTG CATTAAGTAG CGTGCCATCC ATATCAGTGG CTATTAGTTT 720 

35 TATCATTATG TnACCTCGTT TCGTAAATnT AAAATCTTGT TCTTAAATAA GrATATATAC 780 

TCAGCGCACA TACTTTtCTA TTAmCATTTA TATkGTCATT aATTTATCAT ATAATGTAAT 840 

TCTaACAAAT nTTAAtTAGT ATGTACTATC GTCTAATTGG TGG A TTTCTT ATTGGCTCTT 900 

AAgTTTTTAA AAAATGTTGT TAATAATGTG CTACATGCTT CTTTAAGTAC ACCTTTATCA 960 

ACAATTGCAC GATGATTAAA ATTAGATTGT TGCAATAAAT TCATTAAACT GCcACTACAA 1020 

• . .• ' 

CCACCTTTAG GATCATCTGC GCCATAGACG ACTCTTGGAA TGCQACTCAT TACAATTGTT 10 BO 

45 

CCTGCGCACA TGACACATGG TTCTAAGGTT ACATATAATG TGCAACCTTC TAAACGCCAA • 1140 
CTACCTAACA CTTTGGCTGC ACGTTCAATT GCAATATGTT CAGCATGCGC CGTTGGTTGT • 1200 

TGTAGTGTTT CTCTTaAATT ATGTGCTCTA GCGATAACTT CATCATCTTT AGTGATGATA 1260 

SO 

GCACCTATAG GTACTTCGCC TAGTTGAGCT GCTTTTTTAG CTTCTTCAAT CGCTAATGTC 1320 

ATAAAATATA TATCATTTGT CATTTATGTC CAGATACCTC ACTTATGGTA CAATACTCAA 1380 
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CTATTGGCGT AGGTAAATCT TCACTTGCAC ACAAATTAAG TCAAACTTTA GATTTTTATG 
AAGAAAAAGA AATCATCACA GAAAATCCAT TTTTATCAGA CTTTTATGAA GATATCTCTA 
AATGGAGTTT TCAAACTGAA ATGTTCTTTT TATGCAATAG ATATAAGCAA TTTCAAGATG 
TAACACAACT AAATCAAGGT GTAGTTAGTG ATTATCATAT ACATAAAAAT AAGATATTTG 
CTAAAAATAC TTTGAGTTCT GTTGAATTTC AGAAATTCAG TAAAATTTAT GATATTTTAA 
CTGAAGATAT GATTATGCCG AATATGATTA TCTTTTTAGA TGCAGACCTT GATGTGTTAA 
AATCTAGAAT TGCTAAACGT AACCGTAGTT TTGAGCATCA AATAGAaGtG AtACTGTaAg 
TTAAAAAAAG ATTATCXtTGA GTATTATGAG TCCTTACAAA GTAATGGTTC AAATGTAGTT 
TTAATCGATA CnACTTCTAT TGATTTTCTT AAAAATGAAC AAGATTACGA AGATATATTA 
CATATTATAT TACCTATGAT AGGAGATATT ACCAATGAAT AATTACGGTA TTCCACAAAA 
TGCCATTATA ACCATTGCAG GTACAGTTGG TGTTGGAAAA TCAACACTAA sGCAAGCACT 
TGCAGATAAA TTAAACTTTA AAACGTCTTT TGAAAATGTC GAACATAATC CATATTTAGA 
TAAATTTTAC AGCGATTTTG AACGATGGAG TTTCCATTTG CAAATTTACT TCTTAGCTGA 
ACGTTTTAAA GAACAAAAGC GTATGTTTGA ATATGGTGGT GGCTTTGTCC AAGATCX3ATC 
AATTTATGAA GATGTTGATA TTTTTGCAAA AATGCATGAA GAAGAAGGCA CAATGAGTAA 
AGAAGATTTC AAAACATATT CAGACTTATT TAATGCCATG GTCATGACAC CTTATTTTCC 
TAAACCTGAT. GTAATGATTT ATTTAgAATG TAACTATGAT GAGGTCATTG ATCGTATTAT 
TGAACGTGGT CGCGAAATGG AAATTAATAC AGACCCTGAA TACTGGAAAA AGCTATTIAA 
ACGCTATGAC GATTGGATTA ATAGCTTTAA TGCATGTCCA GTTGTACGTA TCAATATTAA 
TGAATATGAT ATCCATAAGG ACCCCGAATC TTTAAATCCT ATGATAAACA AAATTGCTCG' 
AATTATTCAA ACATATCGAC AAGTAGATAC ACGATAAAAG ACTAAAGACA TAGCGTATAT 
GTTTATATTC AATGTATATT CCATAGATAT TATCGATTAT TTTATCAATT CTATCGAATA 
CATTAATTCA CATATACACT ATGTCTTTCT TTTTAATTTA AAGCTTCTAA AATATCTGCC 
GCACTATTTA AAATAATATC AGCTTCATGT AATTCTTCTT TTGTTGCAAT ACCTGTTAAT 
ACACCTATTG CCATACCTAA ATTTGCATTA CTTGCTGTCT TCATATCATT AGCAGTGTCT 
CCTACTATAG CTACTTTCTG AGGATCTACA TTATATTGCT CAAATAAAGG CGATAATACT 
TTAGGATTTG GCTTCTCATA GGCATCCGCT TCGGTAGAAA TGATCAAATC GAACAACGAG 
GTAGCATTGG TATGTGCTAA AAATTGTTCT ACACCTTTTT TAGTATCACT CGTAACAATA 
CCAAGTTGAT AGCCTTTTGC TTTCAAATCG ATAAGTGCTT CTTTAACACC TTCTACCCAA 
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GTATCTTGTC CCGTCACATC ATTAAATGCC TGGATAATTT GTTGTAAAGA TCCTGAACCC 
ATCACTGATT TTGGATCAAT AGATTCTTTA ATGACACCGA GTTGTCTTAA AGCAGCTTCT 
TTATTATGTA CTGGGAAAGT CTCAAGCAAT GATTGTACAA ATCGTACCCC TATTTTTTCC 
CAACTTCTAT CAAATTCAAT TAACGTACCA TCTTTATCAA ATAATATCCA TTCCATTGaT 
ATCAATACTC CTATTTATTT ATTTCGTATT ATGCTGATTC TATGATATTC GTTATCCCCT 
GAAAATGAAC TCGTAGTATT. GTTCTATTTA AATATTGaAT TAAATATAAT AATAAGTGAA 
ATCCCCTTCA ATACTTAACA ATAAACATTG TAAACTTAAT TTATTACCAT GCTTCGCTTC 
ATTGAAAGGG ATTTTAGTCA TGATTAACTT TTGCATATTG TTTTCATGAT TATATTCAAT 
TTTTATTAAT ATTrTGGTAC AACGACTCTC CAACCATTTT TATCTTCTAA AGTACCATTT 
TGAATACCAG TATAGACGTC GTATAATTTT TGAGTAATTT CACCAGTCTC ATTATTATTA 
ATAACGATTT CACGATCTTC GTATCTCAAT GTACCCACAG GTGAAATAAC TGCTGCAGTA 
CCACTACCAA ATACTTCTGT TAACTCACCT TTATCATATG ATTCGAATAA TTCATCGATT 
GAAACGCGGC GCTCTTCGAC TTCATATCCT AAGTTTTTAG CTAATTCGAT AATAGATTTA 
CGTGTAATAC CAGGTAAAAT ACTGCCATTC AACTCTGGTG TAATTACTTT GCCATTTTCA 
ACGAAGAAAA TGTTCATGCT ACCAACTTCT TCGATATATT TCTGTTCAAC ACCATCAAGC 
CATAATACTT GGTCATAACC TAATTTATTT GCATTAGTTT GTGCTAATAA ACTTGcCGCA 
TAGTTACCTG CAACTTTTGC AAAGCCTACA CCGCCACGaA CAGCACGCAC ATATTCATCT. 
TCTACATAGA TTTTAGTTGG TTTTAAAGTT TCT^CCACCAT AATATGCACC TGAAGGAGAT 
AAAATAATTA ATAATTTATA CTGATGTGAT GCACCAACGC CAAGTGCCCC TTCTGTTGCA 
AAAACAAATG GACGAATATA TAATGATTGA CCTTCCCCTT CAGGAATCCA ATCTCTTTCA 
ATATCAACTA AXTGTTTTAG CCCCTCTAAC AATTCTGCTT CGTCTACTXG AGGCATTTCT 
^0 AATCGTGCTA ACGAGTTATT AAGACGCTTA AAATTTTCTT CAGGACGGAA AAGTGCAACT 
TCCCCATCTC TTTTATATGC TTTTAATCCT TCGAATACCG ATTGACCATA ATGAACACCT 
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TGTGCAGCAG GTGAAATTTC AATAGGACCA TAAGGTACTA TCTTCAAATC ATGCCATCCT 
TTATCTGCAT CATAATCATA ACTCAACATA TAATCAGTAA AATATTTACC AAAACCTAGT 
TGAGATGTAT TTGGTTTTTG TTTTAATGTT TCTCGTCGTT CAACTTTAAC TGCTTGTGAC 
ATGGTGATTG CCTCCTAATA ATATTGTATA AGAATTTGTT TAACTTAAAT TATAACAATC 
CaTATTTTGC TGTTCAACAA ATTTTCTAAA AATTCAAAAT TAATTAACAG ATTTCTAGAA 
AGACTATATC TTTTAGTATA AACGTATTAA TTTCACAGAG ACAAGTAATC TGTGTTTTAC 
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TAAGTATAAT GAATAATATT AGAATTCATG CACTAGTTTA TTAAAATAAA GAGTAATTTA 
AAATATCATT CCGTGTATTA AAGTGAATGG AAATGATTAG TTATTATTTT TAACAGTATC 
TTTTTGTTCA ATAGCTTCTA ACATTAATTT AGTCATGCTC GCTAAATCAT ATTTAGGATC 
AAATCCCCAT TCGCCACGTG AACAGCTTGT ATCAATAGAA TCCGGCCAAC TATTAGCGAT 
ACCrrGTCTA ATAGGATCAA CATCGTAATC TAATGTAAAA TTGGGATAGT ATTCTTGAAT 
TGCTTCTTTT ACCATCTCTG GATCAAAACT CATTGCGCTC AAATTATAAC CATTTCTAGT 
TTCTAATTTA GCGTCGTCTG CTTCCATAAG TTTAATAATT GCTTCAATTG CATCATCCAT 
ATACATCATA TCCATATACG TGCCTTTATC TATGAAGCTT GTATAATGAC CCTCTCTTAC 
TGCTTTGAAG TATATTTCAA CAGCATAGTC TGTAGTACCG CCACCTGGCT CTTTAACATG 
CGAGATTAAA CCTGGGAATC TAACACTTCT TGTATCTACA CCAAAACGTT TGAAATAGTA 
TTGACACAAT AATTCTCCAG CTACTTTATT TACACCATAC ATTGTCGTAG GTTGCTGAAT 
CGTTACTTGT GGCGTATTAA CTTTAGGAGT TGAGTCTCCA AATGCACCAA TTGAACTTGG 
TGTGAAAAAG TGCAAATTAT AAGTTCTTGC AGCTTCTAAT GCATTCATTA ATCCACCCAT 
ATTTAAATCC CAAGCTAGAA TTGGATTTTT CTCAGCAGTT GCTGATAATA ATGCTGCCAT 
ATGCATTAGA CTATCCGCTT CAAAGTCCCT AACTAACTCA AACATACGGT CACGATCTGT 
.TACGTCTAAG ATTTCAAATG GTCCATTTTG TACAGGTGAG TCTGCTTCAG GTTCCCTAAT 
ATCTGTAGCA AGAACATTAT CTGTCCCATA AATTTCTCTG CACTTAACAA CTAATTCTGT 
ACCAATTTGT CCTAATGCAC CAGTAATCAT AATTTTTTTC ATAGAAATAT CTCCTTTGtC 
TCTTCTATAT AGCTATAGTC CATCACAAGC GGaCATAATA TTCATTTTCA TAATAATTAT 
AATATAAAAG CGCTTTCTTG TATATATGAC ATGTACATGT TGCTGATATJc TCTGTAAATG 
GAAATTCTAG TTGTATTAAT TGATTTTAGT AATTTATAGC GTTTATTATT GCTAATTACT 
GtCAAATTAA ATTTTTTATC CCTCAACTCT TAAACTCTGG ATATCTTTCA TTATATTAGC 
TTTTTTATAA CCATGGATAT CATGTAAAGC CTTATAAGCn TTAAATAATG TTTCATACCT 
TTGTACTTnT TCCGCTTCTG GATT 
(2) INFORMATION FOR SEQ ID NO: 234: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4721 base pairs 

(B) TYPE: nucleic acid . . 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 
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GCCCATGAGA CAATTTTACT TGCTTTTCCC ATTGGTTATC ACGTTCTTAT TACATAGATT 
TAAACCGAGA AATATTATTC AAACGCTATT TATTGTATCG TTGATTTCTT TAGGACTTAT 
GATAGTGATT CATTTCATCA CTGGAGATAA TTCACGTGTG TATTTTGGGA CAGATACACG 
ACTGCAAACT TTATTGCTTG GTTGTATATT AGCATTTATT TGGCCTCCGT TTGCTTTQAA 



ATTTTACATT ATATCATTTG CAACTTTATT CATTATTGCA ATTGCGGTAC ATCCTTCTAG 
TTTATTTGCT AAATTTTTAA GTATGAAACC TTTACTAATT ATAGGTAAAC GATCATATAG 
CTTATACTTA TGGCATTATC CTATCATTGT TTTTGTGAAC AGTTATTACG TACAAGGACA 
AATACCGGTA TACGTTTATA TTATAGAAAT TTTGTTAACA GCGTTAATGG CTGAAATTTC 
20 GTATCGCTTT ATTGAAACAC CTATACGTAA AAAAGGATTT AAAGCTTTTG CATTTTTACC 

TAAAAAGAAG GGGCAATTTG CTAGAACAGT GTTAGTTATC CTATTATTGG TTCCGTCTAT 



TAAGCAGACA GCGAATAGCA AAGAGGATAT TAAAAAGTCA TCACCACTAT TAATTGGTGA 



CTATGCTAAA AAAGGTCAAA AAGTTGTAG1 AGAGCTTGGT ACAAATGGGG CATTTACGAA 



GCGCTCTAAT GTACATCTAG TCGATTGGTA TAAAGCTTCT GCAGGTCATC CGGAATACTT 



TATTACATTA CTTCTGATAT TTATTATCAA AAATGATGTA TTTCATTAAA AGTTTAGTGC 
45 TTTTTTATTT TCAAATCCCA TAGTAACGGT GCAGAAAAAG TGTTGTAAAC ATTCTAATTG 

GTATATTACA TTCAATGAAG CTTTATTAGG AACAGATTAC ATTATGATAA CAAAGCCCGC 
AAGACACCTA ATCTCTGTTA TAGTTTGTTT TGTCGCAAAA CTATAAAAGT TATAATTGTT 
TGCATACTAA AAAAATAAAA AATATAAAAT TTAAAATAAT TGAGTCGCTA ATGACTATAT 
GTATAGAGTG ..TTTTGATTAT TGGGAGGATA TTTAATTATG AAAAAAATCO . TTACAGCTAC 

55 



TACATAGATT 


60 


TAGGACITAT 


X20 


CAGATACACG 


180 


TTGCTTTQAA 


240 


CTGGTTTTGC 


300 


ATAATGGAGG 


360 


ATCCTTCTAG 


420 


GATCATATAG 


480 


TACAAGGACA 


540 


CTGAAATTTC 


600 


CATTTTTACC 


660 


TTCCGTCTAT 


720 


AGAAGAAAGA 


780 


AGCAAGAGGA 


840 


TAATTGGTGA 


900 


CACAAATTGA 


960 


AATATAAAGA 


1020 


CATTTACGAA 


1080 


TAGTTTCTAT 


1140 


CAGCTGAAAA 


1200 


CGGAATACTT 


1260 


ATTTGATTGT 


1320 


ACTTTTGAAA 


1380 


AGTTTAGTGC 


1440 


ATTCTAATTG 


1500 


CAAAGCCCGC 


1S60 


TATAATTGTT 


1620 


ATGACTATAT 


1680 


TTACAGCTAC 


1740 
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ACAAAATAAC AATGGATATA ATTCTAATGA CGCTCAATCA TACAGCTATA CGTATACAAT 
TGATGCACAA GGTAATTATC ATTACACTTG GACAGGAAAT TGGAATCCAA GTCAATTAAC 
GCAAAACAAC ACATACTACT ACAACAACTA CAATACTTAT AGTTATAACA ATGCATCTTA 
CAATAACTAC TATAATCATT CATATCAATA CAATAACTAT ACAAACAATA GTCAAACAGC 
AACAAATAAC TATTATACTG GTGGTTCAGG TGCAAGTTAT AGCACAACAA GTAATAATGT 
TCATGTGACT ACAACTGCAG CGCCATCTTC AAATGGTCGT TCAATTTCTA ATGGTTATGC 
ATCAGGAAGT AACTTATATA CTTCAGGACA ATGTACTTAT TATGTATTTG ATCGTGTTGG 
TGGGAAAATT GGTTCAACAT GGGGTAACGC AAGTAATTGG GctAACGCAG CTGCATCATC 
TGGCTATACA GTGAACAATA CACCAAAAGT TGGTGCTATC ATGCAAACAA CACAAGGCTA 
TTACGGTCAT GTTGCTTACG TTGAAGGCGT TAACAGCAAC GGTTCTGTTC GTGTTTCAGA 
AATGAACTAT GGACATGGTG CTGGTGTGGT TACGTCTCGT ACAATTTCAG CAAACCAAGC 
AGGTTCATAT AATTTCATTC ATTAATCAAA TGTAAATCAA ATGACXTTCAA TATTCTCTAA 
CATGAGAGTA TTGGCGTTTT TCTTTTATAT AAATATAAAT GAGAGCGGTT TATTCACTGA 
TCTTTAGGGA ACTAAGTAAT AAAGTGATAA TTTATACTAT GTCAGTATGA TTGAGAGTGA 
TTCAATTTAG ATGAAAACCA TGAAAAAATA TATTAAAACA GCATTTTTTT GTAGTATGTA 
TTGGTTAATT GTTCAACTAA ATATAGCAAA TTTAGGTACA AGAATTCCTG ATAAGTATTT 
TCGTCAGAAG TACATAATAT TTAAATCATT TAACTTTGAG AAGCATGGAA AATTTTGGAA 
CAAATGGTTT TACGTAAGAA AATGGAAACA TAAGATTTTA GATGGTCATC AGCTTAATCA 
AAATATATAT GATCAGCGTC ATTTAATGAC AATCAATACT GATGAAATTG AAAAAATGAT 
TATAGAGACA AAGAGGGCAG AGTTGATTCA TTGGATATCG ATACTTCCAG TCATCATATT 
CAAT^AAGGC CCTCGTTTAG TAAAGTATAT AAATATTTTC TATGCAATGA TAGCTAATGT 
TCCAATCATT ATTGTGCAAC GCTATAATCG ACCGAGATTA ACGCAGTTAC TACGCATATT 
AAAACGAAGA GGTGAACGTC ATGACTAAAC ATATCATCGT TATTGGTGGT GGCTTAGGTG. 
GGATTTCTGC AGCAATTCGA ATGGCACAAA GTGGCTATTC GGTCTCATTA TATGAACAAA 
ATAATCATAT AGGAGGCAAA GTGAATCGTC ATGAATCAGA TGGCTTTGGC TTTGATTTAG 
GTCCATCTAT TTTAACGATG CCTTATATTT TTGAAAAATT ATTCGAATAT AGCAAGAAGC 
AAATGTCAGA CTACGTTACA ATCAAGCGAT TGCCACATCA ATGGCGTAgC TTJTTTCCAG 
ATGGAACGAC-TATCGATTTG TATGAAGGTA TTAAAGAAAC AGGTCAGCAT AATGCGATAT 
TGTCGAAACA GGATATAGAG GAACTGCAAA ATTATTTGAA TTATACAAGA CGAATCGATC 
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ATGATTATGT 


ACATACTATG 


CAACAGGCCA 


3660 


GACAAATGTT 


AGGCTATTTT 


ATCAAATATG 


3720 


TATTATCTAT 


GTTATTCCAT 


ATGCAACAAG 


3780 


TCCATCATTT 


AGCCAATGCC 


TTGGAAAAGc 


3840 


CAGGTGCACG 


TGTGGACAAT 


ATTAAAACAT 


3900 


ATACAGGTGA 


GTTTGTAAAG 


GCAGATTATA 


3960 


ATAAATATTT 


AATTCACCTT 


GATACTCAAC 


4020 


CGGCAAGCTC 


AGGATATGTG 


ATGCATTTAG 


4080 


ATCATAATTT 


CTTTTTTACG 


GAAAAT6CTT 


4X40 


AGGTATTGCC 


AGATGATCCG 


ACCATTTATC 


4200 


AAGCGCCAGT 


AGGTTATGAA 


AATATCAAAG 


4260 


AGCCTTTTAC 


CACTGAAGAT 


TATGCGAAGT 


4320 


AAATGGGACT 


TACTGATTTA 


AGAAAACACA 


4380 


ATATTGAAAA 


AAATTATCGT 


TCTAATCGTG 


4440 


AGAAAAACAA 


AGGATiTAAA 


TTTCCTAAAG 


4500 



^GTCAGTA TTTTGAAAAC TTGTACTTTG TAGGTGGATC AGTAAATCCT GGTGGTGGCA 4560 



rGCCAATGGT TACATTAAGT GGGCAACAAG TCGCAGcAAg ATAAACGCGC GAGAAGCGAA 
3AATAGGAAG TGATATCTAT GAAATGGTTA TCACGAATAT TAACAGTAAT AGTGACCATG 
rCTATGGCGT GTGGTGCaTT GATATTTaAT CgTAGACATC A 
(2) INFORMATION FOR SEQ ID NO: 235: 
7 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3516 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNBSS : double 

(D) TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 235: 
CATTCGTGCG CAATGGGCTA AATTAGGTCT AGGTTTAGAT TATAGTAGAG AACGTTTTAC 
rTTAGATGAA GGTTTAAGTA AAGCAGTTAA AAAAGTTTTT GTTGATTTAT ACAATAAAGG 
\ATTATTTAT CGTGGCGAAC GTATTATAAA TtGGGATCCn AAAGCACGTA CAGCTTTATC 
CGaTATTGAA GTAATACATG AAGATGTTCA AGGTGCGTTT TATCATTXTA AATATCCTTA 
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TACAGCGATT GTTGTTAACC CTAATGACGA ACGATACAAA GATGTAATCG GTAAAACTGT .360 

TATATTACCA ATCGTAGGAC GCGAACTGCC TATTTTAGCA GATGAGTATG TTQATATAGA 420 

5 CTTCGGTTCT GGTGCTATGA AAGTGACACC AGCACATGAC CCTAATGATT TTGAAATTGG 480 

TCAAAGACAT CAATTAGAAA ATATTATCGT TATGGATGAA AATGGTAAAA TGAACGACAA 540 

AGCGGGTAAA TATGAAGGTA TGGACCGTTT TGATTGTCGT AAACAGCTAG TTAAAGATTT 600 

AAAAGAACAA GATTTAGTTA TCAAGATTGA AGATCATGTT CATTCTGTAG GTCATTCAGA 660 

ACGATCTGGC GCTGTTGTTG AACCATATTT ATCAACACAA TGGTTTGTGC GCATGGAAGA 720 

CTTAGCGAAA CGTTCATTAG ATAACCAAAA AACAGATGAT CGTATTGATT TTTATCCGCA 780 

ACGTTTCGAA CATACATTTA ACCAATGGAT GGAAAATATT AGAGATTGGA CGATTTCAAG 840 

ACAATTATGG TGGGGTCATC AAATTCCGGC TTGGTATCAT AAAGAAACAG GCGAAATATA 900 
TGTTGGAGAA GAAGCGCCAA CTGATATTGA AAATTGGCAA CAAGATGAAG ATGTATTAGA ' 960 

TACGTGGTTC TCaAGTGCTT TATGGCCtTT CTCyACGTTA GGTTGGCCTG ATTTAGAAAG 1020 

TGAAGACTTT AAACGATACT ACCCAACAAA TGCCTTAGTT ACAGGTTACG ATATTATCTT 1080 

2S TTTCTGGGTA GCACGCATGA TATTCCAAGG CTTAGAATTT ACAGATCGTC GTCCATTTAA 1140 

TGATGTATTA TTACACGGTT TAGTTCGTGC TGAAGACGGG CGTAAGATGA GTAAATCATT 1200 

AGGTAATGGT GTGGATCCAA TGGATGTTAT TGACGAATAC GGTGCTGATA GCTTGCGTTA 1260 

30 CTTCTTAGCA ACAGGTTCAT CTCCAGGACA TGATTTAAGA TACTCAACTG AAAAAGTTGA 1320 

GTCAGTGTGG AACTTTATCA ATAAAATCTG GAATGGGGCA CGTTTCAGTT TAATGAATAT 1380 

CGGTGAAGAC TTTAAAGTTG AAGATATCX3A TTTAAGTGGT AACTTATCAT TAGCAGATAA 1440 

ATGGATTCTA ACACGTTTAA ATGAAACGAT TGCAACAGTT ACTGATTTAA GTGACAAATA 1500 

TGAATTCGGC GAAGTTGGAC GTGCATTATA TAATTTCATT - TGGGATGATT TCTGTGATTG 1560 

GTACATTGAA ATGAGTAAAA TTCCAATGAA TAGTAATGAT GAAGAACAAA AACAAGTTAC 1620 

ACGTTCAGTA TTGAGTTATA CTTTAGACAA TATTATGAGA ATGCTACATC CATTCATGCC 1680 

ATTTGTAACA GAGAAAATAT GGCAAAGTTT ACCACATGAA GGTGACACAA TTGTTAAAGC 1740 

45 TTCATGGCCA GAAGTGCGTG AATCATTGAT TTTTGAAGAA AGTAAACAAA CAATGCAACA 1800 

ACTTGTTGAA ATCATTAAAT CTGTAAGACA ATCACGTGTA GAAGTAAATA CGCCATTGTC 1860 

TAAAGAAATA CCTATTTTAA TTCAAGCTAA AGATAAAGAA ATTGAAACAA CTTTATCACA 1920 

• AAACAAAGAT TATTTAATCA AATTCTGTAA TCCTAGTACC TTAAATATTA gCtGACGTGG 1980 

AAAwTCCTGA GAAAGCAATG ACaTCAGTTG TAATTGCAGG TAAAGTGGTA TTACCATTAG 2040 
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AflAGCGAATT AGATAGAGTA GATAAAAAGC TCTCTAATGA AAACTTTGTA AGTAAAGCAC 2160 

CTGAAAAGGT TATAAATGAA GAAAAACGTA AAAAACAAGA TTATCAAGAA AAATATGATG 2220 

GTGTGAAGGC AAGAATTGAA CAATTAAAAG CATAGGAGTT AGTAACAATG AATTACCTAG 2280 

AGAGCTTGTA TTGGATACAC GAAAGAACTA AATTTGGCAT CAAACCAGGT GTTAAACGTA 2340 

TGGAATGGAT GCTAGCACAA TTTAATAATC CTCAAAATAA CATTAAGGGT ATTCATGTAG 2400 

GTGGCACAAA TGGTAAAGGC TCTACAGTTG CTTACCTTAG AACAGCTTTA GTTGAAAATG 2460 

GTTATGAAGT AGGTACATTT ACGTCGCCGT TTATTGAAAC ATTTAATGAA CGAATTAGTC 2520 

TAAATGGTGT GCCAATATCA AATGACGCTA TTGTAGAATT AGTATCACGT ATTAAACCAG 2580 

TAAGTGAAAT GATGGAACGT GAAACAGATT TAGGTGTTGC AACTGAATTC GAAATAATCA 2640 

CAGCGATGAT GTTTTTATAT TTTGGTGAAA TACATCCTGT TGATTTTGTC ATTGTTGAGG 2700 

20 CTGGATTGGG TATAAAGAAC GATTCGACAA ATGTCTTTAC ACCGGTTTTA TCAATCTTAA 2760 

CTAGTATCGG TCTAGACCAT ACAGATATTT TAGGTGGTAC TTATCTAGAT ATTGCTAGGG . .2820 

ATAAAGGCGC GATTATAAAG CCTAACGTTC CAGTGATATA TGCTGTTAAA AATGAAGATG 2880 

CATTAAAATA TGTTCGTQAA CGCGCAATTG AACAACATGC AAAGCCAATT GAATTAGATA 2940 

GAGAAATTGT TGTTGTATCG CAAAATGATG AATTTACTTA CCGTTATAAA GATTATGAAT 3000 

TAGAAACAAT CATTTTAAGC ATGTTAGGTG AACATCAGAA ACAAAAT6CT GCATTAGCCA 3060 

TAACAGCTCT TATTGAATTA AATGAACAAG GATTAATTGA ATTAGATTTC AATAAGATGA 3120 

TAGACGGTAT TGAATCAGTT CGTTGGACTG GACGTATTGA GCAGGTGCAT GACAAACCTT. 3180 

TAATCATTTT GGATGGCGCA CATAATTCAG AGAGTATAGA TGCTCTAATT GATACAATTA 3240 

AACAGTACCA TGATAAAGAA AAAGTAGATA TTTTGTTCTC AGCAATAAAC GGAAAACCGA 3300 

TTAACEjAGAT GGTCAAACAT TTAAGTTTAA TTGCGCATAC GTTTTATGCA ACTGAATTTG * * 3360 

ATTTTCCGAA AGCGTTACGC AAAGAAGAAA TTGTAGGTAG TATTGAAAAT GATGAAATAC 3420 

AATTAGTAGA TGACTACGTT GAATTTATAA AAAATTATCA AGGTGATACA TTAGTAATTA • 3480 

CCGGTAGTCT GTATTTCATA AGTGAAGTTA AATCAA 3516 
(2) INFORMATION FOR SEQ ID NO: 236: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 7481 base pairs 

(B) TYPE: nucleic acid - ' 

(C) STRANDEDNESS : double ... 
(b) TOPOLOGY: linear 
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TGAGTGATAG AATCAAAAAA GCCATCTCAA AAATTAATCA AGCAAACAAC ATTCCAAACA 
ATGsTCGCAA ATCACCAATG TATCACTCTC CAATTACGTA ACTATGATTT AATTTAAGCA 
TAGTTATTGA GGTTTTGTGA TATATAGTAT AAAATTAATG AGAATTAAAT TTAATAATGT 
AAAATTCATm TTCgGGGTCG GGTGTAATTC CCAACCGGCA GTAAATAAAG CCTGCGACCT 
GCTAGTATGT ATCATATTAG TGGCTGATCT AGTGAGATTC TAGAGCCGAC AGTATAGTCT 
GjGATGGGAGA AGATGGAGGT TTTTrGTTGT GCAATAATCC TCCTATTCTT ACGAGATGAA 

* * • . ' ' * ' 

TGGAAGGAGA AAATTGAATA TGCAACAAAA TAAACX3TCTT ATCACAATAA GTATGTTGAG 
CX5CGATTGCG TTTGTGTTAA CTTTTATCAA GTTTCCTATA CCATTTTTGC CACCATACTT 
AACTTTAGAT TTTAGTGATG TACCGTCACT ACTAGCTACA TTTACGTTTG GACCAGTTGC 
CGGTATCGTA GTTGCACTGG TTAAAAATTT ATTGAACTAC TTATTTAGTA TGGGCGATCC 
AGTTGGACCA TTTGCTAACT TTTTAGCAGG CGCAAGTTTC TTATTAACTG CTTACGCCAT 
CTATAAAAAT AAACGTTCAA CAAAATCTTT GATTACTGGA TTAATCATTG CAACAATCGT 
TATGACTATC GTGTTGAGTA TTTTGAACTA TTTCGTTCTA TTACCTTTGT ACGGTATGAT 
ATTTAACTTA GCTGATATCG CAAATAATCT TAAAGTAATC ATTGTTTCAG GAATTATACC 
ATTCAATATT ATTAAAGGTA TCGTTATTTC TATTGTATTT ATTTTACTAT ATAGAAGGCT 
TGCGAATTTC TTGAAAAGAA TTTAATCAAA TTAAAGCAAA ATAATATACA CATAATAATA 
AAAAGCAGGT GACTATCAAT AAACGATAGC TTGCCTGCTT TTTCTATAGA ACATTTGTCT 
AAAAAATCAA TTATTCaAAT TTTAAAGCGT CCCCATCAAA TGATTCGTCT GCAATTTTAA 
TAGAATCTGt AGGGCATCCa TCAATTGCAT CTTCCATATC TTCATATAAT TCCtCAGGTA 
CTTCTGCAGT ACCTTGGTTA TCGTCS^GGA TTACGAAAGC AATACCTTCX3 TCGTCGTAAT 
CATM*ATATC TGGCGCTGCT GCACCGcATG CACCACATGC AATACAAGTA TCCATATCAA 
CGATTGTATA TTTTGCCAAT GTCTTCGCCT CCTTTGATAA AAATGCTAAA ATAGTAATGT 
GACTAAAATT TTAGACAGCA TCATTTTTAT TTTCAAATTA TCGX3TTTTAC AGAGTGAGGG 
TTAAATTTGC AACACATTAT AAAAACAGCA TTACAACAAA CATTTAACTA TAAAACAAAT 
AAAAGTATTT ACAATATCTT AGTTGGTAAG AAATCTCACC AAACCTTTTT TGACGCTTGT 
AGTCAACAAC AGTTGTCATT ATATCACAGT TTACCACTAT TAAAATATCC GTCTTTTGAG 
CTATTTCTAG AAAAAATCAA TGAATTTAAT GCTGAAATGG AAATCATGTT GCATCCTAGA 
TATACATTTG aAAGCATGGG GCAAACATTT CAAGCAATTC AACTATTAGT GCAAaCCATG 
TCTAATACCA AACAACATGT TTTTCATTTT GTACCAATCT CTCAAAATAA TAAGATACAm 
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AATGAACTAC ATAACTTGTT TAAAGCAATA ACTTTAAAAG GGCCATGTTA CTTACATTAT 
TATTTGCAAG GCTATGATGA ACCAATGTAT ACGAGACAGC AAGTTAGTTT AATAGAAAAG 
CTATCTCAAC AGCAATTGTT TGAATACGAA ATGAATAATT TAGTGACAAT GATGTTTGAA 
TTAGAAAGTG GAGAATATAC TATTTTATCA AAAATAATAA TGAAACCTAC ATTATTAAAT 
CAAACTTATA TTACTTATAC AAAATTGCTT GAACAATTCA CGATGGAAGA TATAGCGGCT 
CAACAACAAG ^TTAAAATCAA TACTATCGAA GATCATGTAC TTGAAATCTT AATCAAAGGT 
TACATGTCTA ATTACGATGA TTATGTTGAA CTAGAAGATC AACTCCAGTT TTTGAATTTT 
TATCAACAGC ATCGTGGCGA AGGATTAAAA TTTTACAAAG AACAATTTGA CACGTTATCA 
TATTTTCAAT TAAAAGTATT AATCGTTGGA TTTGAAAGAG GTGATCTGAA TGTTGCATGA 
TATTTTACGA AACAAATTTG GATTCGAGAG TTTTAAACCG GGACAACAGG AAATTATAGA 
AAGTATAATG TCTCAACAAC ACACTCTAGG TATACTTCCA ACTGGAAGTG GAAAGAGTTT 
GTGTTATCAA ATACCTACGT ATTTATCAGG TAAGCCGACA TTAATTATCT CACCGTTAAT 

ATCTTTAATG GATGACCAAG TTATGCAGTT GAAAATAAAT GGAGAAAAAC GTGTAACATG 

« • - ■ 

TATTCACTCT GGTATGGATG AAATTGAGAA AAAGCATAAT ATTAAATGTT TACGACATAG 
CCGCTTCATC TTTCTAAGTC CAGAATTTCT CCTGCAACCG TCAAATTTTA AATTAATATC 
TATGATAGAC TTTGGCATGA TTGTTCTAGA TGAAGCACAT TGCCTATCTG AATGGGGATA 
TGATTTCAGA CCACATTATG CTCTAATAGG AAAAGTAACA AAGCATTTTA AAGAAGCGGT 
TGTCTTAGCA TTGACAGCAA CTGCACCACC GCATTTACAA GATGATTTGA CGGAAATGTT 
AGCGATTCAA TTCAATGTTA TTAAAACTAC AATGAATCGC CCAAATATAA GCTTTAAGCA 
TCTTAATTTT CATGATGATG AAGATAAAAT TGAATGGTTG CTGCCGTTTC TACAACAGTC 
GGGAGCAACG ATTATTTATG TCTCATCGAA AAAGATGTGT CTGAATTTAG CGCAACTTAT 

ft 

TTATGATTCA GGTTTTCTTA CAGGTATTTA TCATGGTGAT ATGAATTATC AAGAGCGACA 
CACAGTTCAA CAACAATTTT TAAATAATGA TATTCCGATT ATAGTCGCAA CGAGTGCTTT 
TGGTATX3GGA ATTAATAAAA AAGATATTCG CACAATCATT CACTTTCATC TTTCAACAAG 
TCCTTCTAAC TACATTCAAG AAATTGGCCG. TGCGGGTCGC GATGGTGAAC TAAGTCAGGC 
AATTAGTTTA TTCCAACCGG ACGATAAATA TATTTTAGAA ACGTTATTAT TTGCAGATAT 
GATAACAGAA GAAGATGTAC AAAATTTCGA AATAGGAGAA TTTTTAGCTC CCGATAAACA 
AGCCGTTTTG ACAACGTTGC AATCATTCTA TAGTATCGGC GCCTTGaAAC AGATATTTAA 
GCAATCATTT AAACOAAAGC AATTAGGATT CTTTCGCATQ ATTGGCTATT • GCAAATTGGA 
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ATGTTGT6AC AATGATTCTA ATATAACTGA TATCGCAATT TTAAATAAGA AGAAGGTAAT '3660 

TAGAAGTATT GCSATTTGATG AAAAGTTGCA AAATTTATTT CTCAGATAGT ATTACTTTAC 3720 

TAAAAGAAAA TTGACAAGCT ATAATTAGTG TATACACAAT TGAAAAATGA TTGAAATAAT 3780 

TTTGAAAAAT ATACATAAAC ATATGTCATG TGGGTATATT TTATGTAAAA TCATTGTAAT 3840 

AGAATAGAAA GGAAGATGGC TATGTCTAAT AATTTTAAAG ATGACTTTGA AAAAAATCGT 3900 

CAATCGATAG ACACAAATTC ACATCAAGAC CATACXSGAAG ATGTTGAAAA AGACCAATCA 3960 

GAATTAGAAC ATCAGGATAC AATAGAGAAT ACGGAGCAAC AGTTTCCGCC AAGAAATGCC 4020 

CAAAGAAGAA AAAGAGGCCG TGATTTAGCA ACGAATCATA ATAAACAAGT TCACAATGAA 4080 

TCACAAACAT CTGAAGACAA TGTTCAAAAT GAGGCTGGCA CAATAGATGA TCGTCAAGTC 4140 

GAATCATCAC ACAGTACTGA AaGTCAAGAA CCTAGCCATC AAGACAGTAC ACCTCAACAT 4200 

GAAGAGGAAT ATTATAATAA GAATGCTTTT GCAATGGATA AATCACATCC AGAACCAATC 4260 

GAAGACAATG ATAAACACGA TACTATTAAA AATGCAGAAA ATAACACTGA GCATTCAACA .4320 

GTTTCTGATA AGAGTGAAGC TGAACAATCT CAGCAACCTA AACCATATTT TACAACAGGT 4380 

GCTAACCAAT CAGAAACATC AAAAAATGAA CATGATAATG ATTCTGTAAA ACAAGATCAA 4440 

GATGAACCTA AAGAACATCA TAATGGTAAA AAAGCAGCAG CTATTGGTGC TGGAACAGCA 4500 

GGTGTTGCAG GTGCAGCTGG TGCAATGGCT GCTTCTAAAG CTAAGAAACA TTCAAATGAC 4560 

GCTCAAAACA AAAGTAATTC TGGCAAGGCG AATAACTCGA CTGAGGATAA AGCGTCTCAA 4620 

GATAAGTCTA AAGATCATCA TAATGGCAAA AAAGGTGCAG CGATCGGTGC TGGAACAGCA 4680 

GGTTTGGCTG GAGGCGCAgC AAGTAAAAGT GCTTCTGCCG CTTCAAAACC ACATGCCTCT 4740 

AATAATGCAA GCCAAAACCA TGATGAACAT GACAATCATG ACAGAGATAA AGAACGTAAA 4800 

AAAG6TGGCA TGGCCAAAGT ATTGTTACCA TTAATTGCAG CTGTACTAAT TATCGGTGCA 4860 

TTAGCGATAT TTGGAGGCAT GGCATTAAAC AATCATAATA ATGGTACAAA AGAAAATAAA 4920 

ATCGCGAATA CAAATAAAAA TAATGCTGAT GAAAGTAAAG ACAAAGACAC ATCTAAAGAC 4980 

GCTTCTAAAG ATAAATCAAA ATCTACAGAC AGTGATAAAT CAAAAGAGGA TCAAGACAAA ' 5040 

GCGACTAAAG ATGAATCTGA TAATGATCAA AACAACGCTA ATCAAGCGAA CAATCAAGCA 5100 

CAAAATAATC AAAATCAACA ACAAGCTAAT CAAAATCAAC AACAGCAACA ACAACGTCAA 5160 

GGTGGTGGCC AAAGACATAC AGTGAATGGT CAAGAAAACT TATACCGTAT CGCAATTCAA 5220 

TACTACGGTT CAGGTTCACC GGAAAATGTT GAAAAAATTA GACGTGCCAA TGGTTTAAGT 5280 

GGTAACAATA TTAGAAACGG TCAACAAATC GTTATTCCAT AATATAACTA TATAAATTGT - 5340 
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TAAATTGCGC TTATAAGTAT GTAGCGGTTT TTTCATTTTT CAAAGTTTGT TATTTAACAA 
GGTCTTGTCT CGAATATTGG CATATCAATT TAACTTTTTA AATAGTCATC AAAAAGATAA 
AACACCACAA TCAACAAATT TAACGAGGAA GAATAAAAAA TAAATCAACA TATTAAATTG 
TAGTGTTATT CAACTCCGTA GCTAACAATT CTCTATTCAC ATTAAACAAA TTGTCAAAAA 
TATATCATAA ATCTTCAAGC ACAGACTTAG CGCATCAATC ACTGAACTGT TATAATAGTT 
TGGGATTAAA GGAGGCCGAA ACAATGCAAA AAGTTGAAAG TATCATAATT GGTGGAGGGC 
CATGCGGATT AAGTGCGGCT ATTGAACAAA AAAGAAAAGG TATTGATACC TTAATTATTG 
AAAAGGGTAA TGTCGTTGAA TCAATCTACA ATTATCCTAC TCACCAAACA TTTTTCTCAT 



CAAGTGATAA ATTAAGTATT GGQcGAgTAC CGTTTATCGT TGAAGAAAGT AAACCAAGAC 
GTAATCAAGC GCTAGTTTAT TACCGAGAAG TTGTAAAACA TCATCAATTA AAAGTAAATG 
CATTTGAAGA AGTATTAACT GTTAAAAAAA TGAATAATAA ATTTACTATT ACTACGACGA 
AAGATGTTTA TGAATGTCGA TTTTTAACAA TCGCGACAGG CTATTATGGT CAGCATAATA 
CATTAGAAGT TGAAGGTGCG GATTTACCTA AAGTGTTCCA TTATTTTAAA GAGGCACATC 
CGTATTTTGA TCAAGATGTT GTAATTATCG GTGGTAAGAA TTCGGCTATC GATGCTGCTT 
TGGAGTTGGA AAAAGCTGGT GCTAACGTGA CGGTTCTATA TCGTGGTGGA GATTATTCGC 
CTTCAATTAA ACCGTGGATA CTTCCAAATT TCACAGCATT AGTAAATCAT GAAAAAATTG 
ACATGGAATT TAATGCTAAT GTTACCCAAA TAACTGAAGA TACTGTGACT TATGAAGTAA 
ATGGTGAAAG TAAAACGATA CACAATGATT ATGTATTTGC GATGATTGGT TATCATCCCG 
ATTATGAATT TTTAAAATCT GTAGGCATTC AAATTAATAC AAATGAATTT GGAACAGCGC 
CTATGTATAA TAAAGAAACA TACGAAACAA ATATCGAAAA TTGCTATATT GCAGGTGTAA 
TTGCTGCAGG GAACGATGCG AATACCATTT TTATTGAAAA TGGTAAATTC CACGGGGGCA 
TTATTGCTCA AAGCATGCTA GCTAAGAAAC AAACGCCCTT AGAATCATAA AAATAAAGGT 
CTATGTACTA AATAACTTAG TTTTACAACG ACTGACATTC ATGATATGTC AAATGAGGTT 
. GATGACTATT GATTGTACAT AGACCTTTTT ATGTTACXiTA TTCATTATAA TTCAAAATAT 
GATTTGATTT CAGCTTTATC TAAATTGTTG CTTAACGCGA CTAATAATTT TAATCTTGCT 
TTTGGACCAT TCAAGCCGTT AGAAAAAATA AAACCTTGTT GTGCGAGTTG GTAACCACCA 
CCATCGTATG CGTAAGTTGG ACTCACAATA CCATTAAAGG AACGTGAAAC TAGCACAATA 
GGTATATTTA AAGATACTAA TTGTTGAAXC CCTTCTAATG CGCTTGGAGG TATGTTGCCT" 
TGTCCTAACG CTTCAATAAC CATACCATCG ATACCTTCTC GACTATAAAA ACTAAAAATG 
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TCCAATGCTT GTTGGCGATA TGGCATATGA. TGGAATTGCA CACGATCCTT TGTCAATACA 
CCTAGCGGAC CATGATTTGG ACTTTGAAAT GTGTTTGTAT TAGACGTATG TGTTTTGGTA 
ACATTACX3CG CCGTATGAAT TTCATCATTA AaTACAACCA TCACGCCTTT ATGACGGGCC 
TTTTCATCAG AGGCAACGCG AATAGCGGAA ATATAATTAT ATAATCCGTC AGAACCAATT 
TCATTAGACG AGCGCATTGG CCAAGAAliTA ACAACAGGTT G 
(2) INFORMATION FOR SEQ ID NO: 237: 
(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 6346 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDBDNESS: double 
- -'(D) TOPOLOGY: linear ' 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 237: 

ATGAATTATA CCTTCCACTA GAAGTGTCGG TATTTATGTG CCTGGTGGTA AAGCAA6TTA 

TCCTTCAACG GTATTAATGA CAGCGACGTT AGCACAAGTA GCAGGTGTGG AAAATATTGT 

CGTTGTGACA CCACCTCAAC CTAATGGTGT GTCTCAAGAA GTATTAGCAG CATGCTATAT 

TACGCAAGTT GATCAAGTAT TTCAAGTTGG TGGTGCTCAA AGTATTGCTG CGTTAACTTA 

TGGCACAGAA ACGATACCTA AAGTTGATAA GATTGTAGGT CCAGGCAATC AATTTGTTGC 

ATATGCCAAG AAATATTTAT TTGGACAAGT AGGTATTGAC CAAATAGCTG GACCAACAGA 

• • • ■ • ■ 

AATAGCACTT ATTATTGATG AAACAGCAGA TTTAGATGCC ATCGTATATG ATGTTTTTGC 

ACA^GCAGAA CATGATGAAT TAGCACGTAC ATATGCCATT AGTGAAGATG CGCAAGTCCT 

TAAAGATTTA GAATCAOGTA TTGCTAAAGC ATTGCCTAAT GTGGACAGAT ACGACATTGT 

TTCTAAAAGT ATCGCTAATC AACACTACCT TATCCATGCT AGTAATTTTG ATGAAGCATG 

CCATGTCATG AATACAATCG CGCCTGAACA TGCGTCGATT CAAACAGTAA ATCCTCAACC 

ATATATTGAA AAAGTGAAAT ATGTGGGTGC ATTGTTTATT GGACATTATT CGCCAGAGGT 

CATAGGAGAT TACGTTGCAG GTCCAAGTCA TGTATTACCT ACAAATAGAA CAGCTAGATT. 

TACCAATGGG TTATCGGTCA ATGATTTCTT AACACGGAAC ACGGTCATCC ATTTATCAAA 

AGATACGTTT GAACAAATTG CTGATTCAGC ACAACATATT GCTCATGTTG AAGCATTATA 

CAATCACCAG CAGTCTATTT TAATACGTCA GTCTTAGGGG AGTGTAATTG AAATGATTTA 

TATTGATAAA AATGAAAGTC CAGTTACGCC GTTGGATGAA AAAACAATGA CGTCTATTAT 

TAGTGCAACg CnATATAATT TATATCCTGA TGCAGCATAT GAACAATTCA AGGAAGCTTA 
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GATTCAAAAG TTAATGCTGA TCATGCCAGA AGGTCCGGCA TTAACGCTAA ATCCTGATTT 
TTTTATGTAT CAAGCATATG CGGCACAAGT AAATCGTGAA ATTGCATTTG TAGATGCAGG 
ATCAGATTTA ACGTTTGATT TGGAAACCAT TTTAACGAAA ATCGATGAAG TACAACCATC 
ATTTTTTATT ATGAGTAATC CACATAACCC TTCAGGCAAG CAATTTGATA CGGCATTTTT 
AACAGCTATT GCAGATAAGA TGAAAGCATT AAACGGATAC TTTGTCATTG ATGAAGCATA 
TTTAGATTAT GGTACGGCAT ATGACGTGGA ACTGGCACCA CACATCTTAA GAATGCGTAC 
ATTATCAAAG GCGTTTGGAA TTGCCGGCTT AAGATTAGGT GTCTTAATTA GTACTGCTGG 
AACGATAAAG CATATTCAAA AAATAGAACA TCCATATCCA TTAAATGTAT TTACGCTAAA 
TATT6CGACT TATATTTTTA GACATAGAGA AGAGACAAGA CAATTTTTAA CGATGCAACG 
ACAGTTAGCT 6AGCAGTTAA AACAAATATT TGATACACAT GTTGCAGATA AAATGTCAGT 
GTTCCCATCA AATGCTAATT TTGTACTTAC TAAAGGCTCA GCAGCGCAAC AATTAGGACA 
ATACGTATAT GAACAAGGAT TTAAACCTCG CTTTTATGAT GAGCCGGTGA TGAAGGGCTA 
TGTAAGATAC TCAATTGCAA CAGCATCACA GTTAAAGCAA TTAGAAGAAA TTGTTAAAGA 
ATGGAGTGCA AAATATGATT TATCAAAAAC AACGAAACAC AGCTGAAACG CAACTAAATA 
TTTCAATATC TGATGATCAG TCACCATCGC ATATTAATAC AGGTGTGGGC TTTTTAAATC 
ATATGTTAAC CTTGTTTACA TTTCATAGCG GTCTGTCATT AAACATTGAG GCACAAGGTG 
ATATTGACGT AGATGATCAC CACGTAACTG AAGATATCGG CATTGTCATT GGCCAATTGT 
TACTTGAAAT GATTAAAGAT AAAAAGCATT TCGTTCGTTA TGGAACGATG TACATTCCAA 
TGGATGAAAC ATTAGCACGT GTCGTTGTGG ATATAAGTGG GCGCCCATAC CTATCATTCA 
ATGCATCATT AAGTAAAGAA AAAGTTGGTA CGTTTGATAC GGAGTTAGTA GAAGAATTTT 
TTAGAGCGGT CGTAATCAAT GCAAGATTAA CAACGCATAT TGATTTAATT CGTGGAGGTA 
ATACACACCA TGAAATTGAA GCTATATTCA AAGCGTTTTC CCGTGCATTA GGCATAGCGC 
TAACTGCAAC TGATGATCAG CGTGTGCCGT CATCGAAAGG TGTGATTGAA TGATTGTCAT 
CGTTGATTAT .GGATTAGGGA ATATTAGTAA TGTAAAACGC GCTATTGAAC ATTTAGGGTA 
TGAGGTGGTT GTCTCAAATA CCTCAAAAAT AATCGATCAA GCAGAAACAA TCATATTGCC 
CGGTGTCGGC CATTTTAAAG ATGCGATGTC AGAGATAAAA CGATTAAATC TCAATGCAAT 
ATTGGCTAAG AATACTGATA AGAAGATGAT TGGTATTTGT TTAGGCATGC AATTAATGTA 
TGAGCATAGT GATGAAGGCG ATGCATCTGG ATTAGGGTTT ATCCCAGGAA ATATTTCGCG 
TATCCAAACA GAATACCCAG TGCCACACTT AGGCTGGAAT AATTTAGTGA GTAAGCACCC 
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AATTGCATAT GCGCAGTATG GGGCTGATAT TCCGGCAATT GTTCAATTTA ACAATTATAT 3000 

TGGTATTCAA TTCCATCCTG AAAAAAGCGG TACATATGGG TTACAAATTT TGCX3TCAGGC 3060 

• • * ■ - 

^ AATACAAGGG GGATTTATAA ATGATTGAAT TATGGCCAGC GATTGATTTG ATTGGGTCAA 3120 

CAAGTGTGAG GTTAACAGAG GGTAAATATG ATAGTGAAGA AAAAATGTCA CGCTCGGCTG 3180 

AAGAAAGTAT TGCTTACTAT AGTCAATTTG AATGTGTGAA TCGTATTCAT ATCGTCGACT 3240 

10 

TGAjTAGGTGC TAAGGCACAG CATGCCCGAG AGTTTGATTA TATTAAGTCA, TTGAGGAGAT. 3300 

TAACAACCAA AGATATTGAA GTAGGTGGTG GCATTCGTAC GAAGTCACAA ATCATGGACT 3360 

ACTTTGCCX5C AGGGATTAAT TATTGCATAG TTGGAACGAA AGGTATTCAA GATACTGATT 3420 

15 

GGCTTAAAGA GATGGCACAT ACATTTCCAG GTCGCATTTA TTTATCTGTT GATGCCTATG 3480 

GAGAAGATAT TAAAGTGAAC GGATGGGAAG AGGACACAGA GTTAAATTTA TTTAGTTTTG 3540 

20 TGAGACGGTT ATCGGATATA CCTCTTGGCG GCATTATATA TACTGATATT GCTAAAGATG 3600 

GCAAAATGTC CGGACCTAAC TTTGAATTAA CTGGTCAATT AGTAAAGGCA ACGACGATTC 3660 

CTGTCATTGC TTCCGGTGGT ATTAGACATC AGCAAGATAT TCAACGATTA GCGTCGCTAA 3720 

25 ATGTTCACGC TGCTATTATA GGAAAGGCTG CACATCAAGC ATCTTTTrGG GAGGGGCTAA 3780 

AATGATTAAA AAACGTATCA TTCCATGTTT AGATGTCAAA GATGGTCGTG TCGTTAAAGG 3840 

GATTCAATTT AAAGGATTAA GGGATATTGG GAATCCTGTT GATTTAGCAA TGTATTACAA . 3900 

TGAAGCGGGT GCTGATGAAT TAGTATTTTT AGACATCTCT AAGACGGAAG AGGGTCATAG 3960 

CTTAATGCTA GAAGTGATTG AACAGACAGC GTCACGCTTG TTTATCCCTC TTACTGTAGG 4020 

GGGTGGGATT CAAAGTCTCG ATGATATTAC CCAATTGCTA AATCATGGTG CAGATAAAGT 4080 

35 

ATCATTAAAT TCAAGTGCTT TAAAAAATCC ACAGCTCATT AAACAAGCGA GTGATAAATT. 4140 

♦ 

CGGTSGACAA TGCATCTGCA TAGCAATTGA TAGCTATTAT GATCCTGAAA GAAAAGCACA 4200 

TTATTGTTGT ACGACTGGTG GTAAAAAAAT GACAAATATT AAAGTATATG ACTGGGTACA 4260 

40 

GCAAGTAGAA CAGTTAGGTG CAGGTGAGCT CCTCGTTACA AGTATGGGAC ATGATGGTAT . . 4320 

GAAACAAGGC TTTGATATTG AACACCTAGC AAATATTAAG TCTCTTGTAA ATATTCCAAT ■ 4380 

4S CATTGCTTCT GGTGGTGGTG GCAATGCACA ACACTTTGTA GAATTATTTG ATCAQACGGA 4440 

TGTTTCTGCA GGTTTAGCTG CAAGTATATT ACATGATCGA GAAACGACGG TTCAATCTAT 4500 

TAAAGAAGTG ATACGGCAAG GGGGTATAGC AGTAAGATGA CCAAATATAA AATTGATTTT 4560 

. AGCAAAGGTT TAGTGCCAGC AATTTTACAA GATAATCAAA CAAAACAAGT ATTGATGTTG 4620 

GGTTATATGA ACCAAGAAGC TTTTGATAAA ACGATAGAAG ATGGTGTGGT ATGTTTCTAT 4680 
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AAAGATATTC. ATGTAGATTG CGACAATGAC ACTATTTTAA TTGATGTCAT ACCAAATGGA 4800 

CCAACATGTC ATACAGGCAG TCAAAGTTGT TTCAACACAG AAGTTCCATr TTCAGTGCAA 4860 

ACATTAGCGC AGACAGTTCA AGATAGTGCC CAATCCAATA ATGAAAAGTC ATATACAAAA 4920 

TATTTATTAA CAGAAGGTAT AGAAAAGATT ACAAAAAAAT ACGGTGAAGA AGCTTTTGAA 4980 

GTCGTAATTG AAGCAATTAA AGGTGACAAA AAAGCATTTG TAAGTGAAGT AGCAGATGAA 5040 

CTTTATCATT TATTTGTCTT GATGCATGCG CTTGGCGTCG ATTTTTCAGA AATTGAGGCXS 5100 

GAATTAGCGC GTAGACATCA TAAGCGCAAT AACTTTAAAG GTGAACGACA AAATATCGAA 5160 

CAGTGGTAAA GCAAGTATGO ACTAAGATAT AAGGAAAAGG ATCATGGCTT ATACACTTAC 5220 

AAATATTGTG GAAAACGTGA CATTTTCAAG TTTAAAATAC GACACCAACA TATTTTAACT^ 5280 

ATX5AATGCTG TGATGGTACT AAAGTTGCXJA ACTCGTTATA GATAAGTAGT GGATAATCAC 5340 

AATAGGAAAT CAAAAATAAT TATAAAAAGT AAATTGAGCA ACTCAGGAAT AGATGTCACT 5400 

GTTAAAGATG TC6AAAAGTA TATGAATCGA TATAAT6AAG TTATGAAGGG AAAAAATGGC 5460 

GAAAAAGCTA AAGAGTTATG TTTGTCGTTA CTACCTATTA ATATCATAGT TGTCTTTACA 5520 

25 TTCTTTGTAT TTATACTATA AATACAAATA TATCTAGCCT GAAATAGAAA TGTCATAGCC 5580 

' TA7TTAAAAG ACAATCTCCA TTAGAACTAA GATATGCATC CCGAAAGTTA GACTAAAAAA 5640 

CTAACTTTAT GGGATGTATT TTTATGCTAA TCATCATAAA TTCGAGATTA AGTTAAAGGT 5700 

AGTTCAAGAG TAATTAAACA ATAAATvAAA AATAGTAGGA TACXTACTTT GAGGGAAGAA 5760 

AATTAACTGT ATATATTTAG TTTAGGAACA AGTATTACGG TTTATCCTGA TACAATTATT 5820 

GTGGATGGGA TGATATTTTT AGGTTTAAAA TACGACACCA GCAAACATAA TAACTGTAAT 5880 

AGCTCATAAA TCTCCCCATA TAGCTAATCT AAAAAAATAA TACATCATTG GAATTAAGCC 5940 

CCAAiicATGT AAATATTAAA AATCAAAAmA GATATmTGTA AAAaAGTTAC AATTtGCATA 6000 

ATTAAATTGT GTCTAATTAT TGACTAATTA AATTTTGCCA AATATAATAT TAATTAATAA 6060 

TTTGaAATGA TTAGCGTATA CACTTTAAAT TCTCITTGGA GAATATATTT TTTAAATACA 6120 

AATGTAAACG CTTTCTCGTC AAATTAAACA ATAGAAAGGA TGGTCATTAT GAGTGCTTGG 6180 

TTAAGTAAAT TATTTGAGTT TATTCCTCGA ATAATTATCA ATTTGTTTAT CTAAAATAAA 6240 

AAAATAGAGG TGCTGACAAT GATGAAAAGT CAAAATAAGT ATAGTATTCX; TAAATTTAGT 6300 

GTAGGTGCAT CTTCCATTTT AATAGCTACA TTACTATTTT TAAGTG 6346 

SO (2) INFORMATION FOR.SEQ ID NO: 238: 

{i) SEQUENCE CHARACTERISTICS: 
- (A) LENGTH: 3775 base, pairs 
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CO STRANDEDNESS : double 
(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SSQ ID NO: 238: 
TGATAATGAT TCTCATTGTC ATACATCACG AAGGAGGCTA ATTAGTCAAT GAATAAAGTA 
ATTAAAATGC TTGTTGTTAC GCTTGCTTTC CTACTTGTTT TAGCAGGATG TAGTGGGAAT 
TCAAATAAAC AATCATCTGA TAACAAAGAT AAGGAAACAA CTTCAATTAA ACATGCAATG 
GGtACAACTG AAATTAAAGG GAAACCAAAG CGTGTTGTTA CGCTATATCA AGGTGCCACT 
GACGTCGCTG TATCTTTAGG TGTTAAACCT GTAGGTGCTG TAGAATCATG GACACAAAAA 
CCGAAATTCG AATACATAAA AAATGATTTA AAAGATACTA AGATTGTAGG TCAAGAACCT 
6CACCTAACT TAGAGGAAAT CTCTAAATTA AAACCGGACT TAATTGTCGC GTCAAAAGTT 
AGAAATGAAA AAGTTTACGA TCAATTATCT AAAATCGCAC CAACAGTTTC TACTGATACA 
GTTTTCAAAT TCAAAGATAC AACTAAGTTA ATGGGGAAAG CTTTAGGGAA AGAAAAAGAA 
GCTGAAGATT TACTTAAAAA GTACGATGAT. AAAGTAGCTG CATTCCAAAA AGATGCAAAA 
GCAAAGTATA AAGATGCATG GCCATTGAAA GCTTCAGTTG TTAACTTCCG TGCTGATCAT 
ACAAGAATTT ATGCTGGTGG ATATGCTGGT GAAATCTTAA ATGATTTAGG ATTCAAACGT 
AATAAAGACT TACAAAAACA AGTTGATAAT GGTAAAGATA TTATCCAACT TACATCTAAA 
GAAAGCATTC CATTAATGAA CGCTGATCAT ATTTTTGTAG TAAAATCAGA TCCAAATGCG 
AAAGATGCTG CATTAGTTAA AAAGACTGAA AGCGAATGGA CTTCAAGTAA AGAGTGGAAA 
AATTTAGACG CaGTTAAAAA CAACCAAGTA TCTGATGATT TAGATGAAAT CACTTGGAAC 
TTAGCTGGCG 6ATATAAATC TTCATTAAAA CTTATTGACG ATTTATATGA AAAGTTAAAT 
ATTC^^AAAAC AATCAAAATA ATTAAGGAGT TTTACGATGC TACTTAAACC AAAATACCAA 
ATCGTTATTG CTGGTTTATG TCTTGCAATA GTAGCTATCT TAAGTTTAAT GATTGGAAAT 
ACGCTTGTGT CACCAGGTAC GGTGATACAG GCGTTATTCA ACTTTGATAG TGAAAACGAT 
TTACATGATG TTGTCACTGG TGCACGGGCG TCGAGAACAA TCATTGCGTT ATTGACTGGT 
GCTGCCCTTG CTGTCTCAGG TTTGTTGATG CAAGCACTTA CACGAAACCC AATAGCCTCA 
CCAGGGCTTT TCGGTGTCAA TGCAGGCGCA GTATTTTTTG TCATTTTTAG TATTACATTT 
ATCCAAATTC AATCTTTTAA AATQATTGTA GTTATTGCAT TTTTGGGGGC TATTGTTGTT 
ACTGTATTAG TTGTTGCACT AGGTATGTTT AGACAAACAC TATTCTCACC TCACCGTGTC 
ATTTTGGCAG GTGCTGCGAT TGCGATGCTA TTTACAGCCT TTACTCAAGG CATACTTATT 
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AATATTTGGG ATATCCCATG GATTATTCCG CTTGTATTGA TACTTATTTT AATTGCATTT 
AGCATGGCTG CACACATCAA CATCTTGATG ACAAGTGACG ACATTGCAAC CGGCCTCGGT 
CAAAACATAA AATTAATCAA ATGGATGATT ATTATGCTCA TCAGTATX5TT AGCCGGTATT 
TCGGTAGCCG TAGCTGGATC AATCGTCTTT GTGGGTCTTA TCGTACCGAA TATTAGCAAA 
CGATTATTAC CACCAAACTA TAAGTATTTA ATTCCTTTTA CTGCATTAGC TGGAGCAATC 
CTAATGATCA TTTCAGACAT TGTTGCTCXyr ATAATAATTA AGCCACTAGA GTTGCCTATC 
GGTGTCGTTA CCGCTGTCAT TGGCGCTATT GTCTTAATCT ATATTATGAA GAAAGGACGT 
CAACGCTTAT GACCGAAAAG ATTAATAAAA AAGACAATTA CCATCTCATC TTCGCGTTAA 
TCTTTTTAGC 'CATCGTTTCA GTGGTAAGTA TGATGATTGG TTCAAGCTTT ATACCATTAC 
AACGCGTACT GATGTACTTT ATAAATCCAA ATGACAGTAT GGATCAATTC ACTTTAGAAG 
TATTACGCTT ACCTCGCATT ACACTTGCGA TTTTAGCAGG TGCCGCACTA GGAATGAGTG 
GTTTAATGTT GCAAAATGTA TTAAAAAATC CAATTGCCTC ACCTGATATT ATCGGTATCA 
CAGGTGGTGC TAGCTTAAGT GCTGTTGTCT TTATTGCATT TTTCAGCCAT TTAACAATAC 
ATTTACrrCC ACTATTTGCA GTATTAGGTG GCGCAGTTGC AATGATGATA CTATTAGTGT 
TTCAAACGAA AGGACAftATA CGCCCGACAA CACTCATAAT CATCGGTATT TCGATGCAAA 
CGTTGTTTAT TGCGCTTGTC CAAGGATTAC TCATTACAAC GAAGCAATTA TCTGCTGCCA 
AAGCTTATAC ATGGCTAGTC GGAAGTCTTT ACGGTGCTAC GTTTAAAGAT ACAATCATTT 
TGGGTATGGT TATTTTAGCT GTTGTGCCGT TGTTATTTCT TGTTATACCA AAAATGAAAA 
TATCTATACT TGATGACCCT GTAGCGATTG GCTTAGGCTT ACATGTACAA CGTATGAAAC 
TAATCCAATT AATCACTTCT ACTATACTCG TATCTATGGC AATCAGTTTA GTAGGTAACA 
TTGOiiTTTGT CGGTTTAATC GCACCACATA TCGCGAAAAC AATCGTTCGC GGAAGTTATG 
CTAAAAAGTT ACTAATGTCA GCAATGATTG GTGCCATATC AATTGTTATT GCAGACTTAA 
TTGGGCGTAC CTTATTCTTG CCTAAAGAAG TGCCAGCAGG TGTATTTATT GCTGCTTTTG 
GTGCCCCATT GTTCATATAC TTATTATTAA CCGTGAAAAA GTTATAACGA TATTATTAAA 
ACAAAATGAC CTCACAACGA AGTTAGCTAA ATGATTCAGT TAACTAACCG TTGCGAGGTT 
TTTTTATACA TATAGTTGTT GTTATTGTTA ACAAGCGTCG ACTTTCTTAA TTACATATTA 
ATACTTTATA TACAAATAAC ACCGACTCAT ATTCTATAAT ATCAATCAAT ATTCTTCGAT 
T TTTCAAATA TCGATAACTA TTTCTTATTT AAATATAGTG TTTGATAATG TCATTTATTC 
AAAAACACAA ATTTTAATAA AAATATCATA TTATTTTTAA TTGTAAATTA TGGATTATTT 
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ATATAATAAC CATGACAAAA TTAGAGATTT TATAATCATT GAAGCATATA TGtnTCGTTT 
TAAGAAAAAA GTCAAGCCTG AAGTCGATAT GACTATAAAA GAATTTATAT TACTGACTTA 
TTTATTTCAT CAGCAAGAAA ACACACTTCC ATTTAAGAAG ATTGTTTCAG ATTTATGTTA 
TAAACAATCG GATTTAGTAC AGCATATAAA AGTACTTGTG AAACATTCAT ATATTAGTAA 
AGTTCGAAGT AAAATTGATG AGCGTAATAC TTACATTTCA ATATCTGAAG AACAACnAGA 
nAAAATTGCA GAACnTGTTA CATTGTTTGA TCAAATCATT AAACAATTTA ACCTT 
(2) INFOW-SATION FOR SEQ ID NO: 239: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1361 base pairs 

(B) TYPE: nucleic acid . .. 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 239: 
AGAAAAATTA GCCTACCTAT GCAAGTTGTT ATTGCATTAG TGTTAGGTGT TGTCGTAGGA 
CTTTTATTAT ATGGACAAGA AAACGTAGCA AATTACATTA AACCATTTGG TGACGTATTT 
TTAAATTTAA TTAAAATGAT CGTTATACCA GTTGTATTTT GCTCACTAGC GCTTTCTATT 
TCGAACGTTG GGGAATCGAA AACTGTAGGG CGTTATGGCT GGaAAACAAT TTTATACTTT 
GAAATTATTA CAACAATCGC AATAGGTTTA GGGATTATCT TCGGTAACCT ATTTAAACCA 
GGTGCTGGAT TAGACCCAAC AAAATTACCT AAAGGTGATA TTTCTAAATA TCAATCAACT 
GCACATGCAG CAGAACAATC TACATATGGa AATCATTTTA TTGATACCAT TGTACATATT 
ATTCCGACAA ACTTTTTTGA AGCTTTAAAT AAGGGTGAAT TATTACCTAT TATCTTCTTC 
GCAGTATTCT TTGGATTAGG ATTAGCTGCT GTAGGTAAAA AAGCAGAACC AGTTAAAGAA 
TTTTTAAGCG GATCGCTTGA AGCTGTGTTC TGGATGATTA ATAAAATTTT AAAATTAGCA 
CCACTTGGAG TGTTTGCATT CATTTGTACT ACAATTATTA CATTTGGTGC ATCCGCATTA 
TTACCACTAT TAAAATTAGT ATTAGTTGTT GTCTTTGCAA TGGTGTTCTT TGTATTCGCT 
ATACTAGGAC TAGTTGCATG GATGTGTGGT ATTAATATCA TGAATATTAT TAGAATCTTG 
AAAAGTGAAT TGCTTTTAGC ATTTTCTACA TCAAGTTCGG AAGCTGTACT TCCTGTAATG 
ATGAAGAAAA TGGAAAACTT CGGTTCTCCA AAAGAAATTA CTTCTTTTGT TATACCAATT 
GGTTATACGT TTAACTTAGA TGGATCAGCA CTTTATCAAT CTATTGCAGC ATTATTCGTT 
GCACAGATGT ATGGAATGCA CTTAACATTA TCAGAGCAAA TTGTGTTGAT GTTAACATTA 
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ACATTAGGTG CCATGGGCTT ACCGGCACAA GGTTTAGCAT TAATTATTGG TGTTGACCGT 1140 

ATCTTAGATA TGGTACGTAC ATGTGTAAAC GTTATTGGTA ATGCATTATC AACAATCGTT 1200 

ATAGCTAAAT GGGAAAACGT ATATGACAAA GCAAAAGGTC AAGAATATTT AAAATCAATT 1260 

TAAAAAATAC TATCTGACAT TTAArGnCCC TTACAACCTT TGGTTgTnAG GGCTnTTTTA 1320 

TGTCATGCGT CTTAAAGCCA GGCCGTATAn. CGGTAAGCGT A 136 i 



{2) INFORMATION FOR SSQ ID NO: 240: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1489 base pairs 

(B) TYPE: nucleic acid 

15 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear - 
(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 240: 

20 

TCAATATGTA AATCGGCGAT TGTCCCTATC tTCATACCCT TACCTTCTTT ACTCAAATTA 60 

AAATGTTATT TATTATGCCA TaGCTTATCT AATATATATA GTTAACTGCT TCATTTAGAT 120 

2s GATTATTTTA TATTTTTGCA TAAAAACTTA TATCTTTTCA AAAAAATCGA TAAGTTTTAG 180 

TTATCATACC CTTACCTATC AAATGTTTTT TCTTATATTT AAAAAAATAA TTGCTTTATT 240 

AAATGGATTT CTTTAGTATT TATAATTAAG AAAACGCTTA CACACAACTT TTTTATTTGC 300 

30 TTTATCCTGA GGAGGAAAAT TATGGCAAGA AAATTGCATA GAGAGTTGAA TAACAGACAC 360 

ATCCAATTAA TAGCAATTGG GGGCGCAATT GGAACTGGGT TATTCCTAGG ATCAGGTCAA 420 

ACAATATCTT TAACTGGTCC ATCACTGTTA TTCACATACA TGATTATTGG GGTTGTACTA 480 

35 TTCGCTTTTA TGCGCGCATT AGGCGAATTG TTGTTGAGCA ATACAAGATT TAATTCATTT 540 

GlTGAlATTG CAAATGAATA TTTAGGCCCT TTTGGTGGCT TTGTCATTGG CTGGACTTAC 600 

TGGTTATGTT GGATTGTATC AAGTATGTCA GACCTAACTG CGATGGGACA ATACTTTGCA 660 

40 

TTTTGGTATC CACAAGTCCC AAATTGGATT ACCGTGCTAT TTATTGTTTT AATCTTGATT 720 

AGCTTCAACT TATTAGGTGC CAGATTATTT GGTGAACTGG AGTTTTGGTT CTCGATTATT 780. 

AAAGTTGTCA CAATTATTGC GATGGTTATC GTTGGTCTTG TATTAATCTT TTTCTCATTT 840 

45 

AAAACACATT ATGGACATGC ATCATTCACA AACTTAATCA GTCACGGTGG CATGTTCCCT 900 

GGTGGAaCAT TTGGTTTCTT AATGTCATTC CAAATTGCTG TATATTCATT CATTGGTATT 960 

GAACTTATAG GTGTAaCTGC TGGTGAAaCG AAAGATCCTG AAAAAACCTT ACCGAAAGCA 1020 

50 • -- ' ' * - - * 

ATTAATAATG TACCTATCCG TATTTTATTA TTCTATATCG GTGGTCTATT AGTAATTATG 1080 

• ■' . • - 
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TTAATCGGCG TACCATTTGC AGCAGGTGTC GTTAACTTTG TCGTGCTAAC TGCCGCGOCC 1200 

TCTGCTACAA ATAGTGGTAT CTATTCGAAT AGTCGTATCT TATTCGGACT GTCACAACAA 1260 

GGGTTAGGTC CTAAAGTTTT AAATAAAACG AATAGTCATG GCGTGCCTTA TTTATCAATG 1320 

TTAGTTTCAT CAATTGCATT ACTTATAGCA GCCTTGTTAA ACTACATTTT CCCTAATGCA 1380 

ATTCAACTAT TCATATACGT TACAACGTTA tCAACTGTGT TGTTTTTAGT TGTtTGGGCA 1440 

ATGATnATTG TCGCTTATCn AATGTATTTG GAAAAAGCAT CCTGAGGCA 1489 



(2) INFORMATION FOR SEQ ID NO: 241: 

(i) SEQUENCE CHARACTERISTICS: 
15 (A) LENGTH: 5000 base pairs 

(B) TYPE: nucleic acid . 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

20 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 241: 

TTTTCCATCA TrATcACCAT TTAAGACAAT AGCTGTATGA CCATATCCTC CACCAAATCT 60 

25 TCCACTAAAA ACCACTAAGT CCCCAGGTTC AGCTTTGAAA GTTGGTGTGT TGTGATAAAT 120 

TTTAGCTTCA CTATTAAAAT TATTTGCATA TGGTATATCT TTAGCTCCAT ATCCTTTtAA 180 

TCCAkGACCA TAAAGAkGAT TCCAATATAC ATTAACTAAA TCGAAACATT GCCATCCATA 240 

30 ACTACCGTCG AAATCCCATC CTCTATTCTC TAATGTTTTC AAATAATTTA ATGTACTGCT 300 

ATTACTATTA CTTTTATTAT TTGAAGACAC TGTTTTTGGT TTTGGTTCTA CTAATGGTGT 360 

CATTGGCACT TTTAATTTTT GACCAATAAA TATTAAATTA GGATTTGCTA TATTATTTGT 420 

35 ATTTTGAATA TTTGAAACTG TAGTTTTGTA TTTTAATGCT ATAGCACTAA GTGTGTCTCC 480 

TTTTHrrACA GTATAGATTT GTGTTTTTGG AGCTTCTCTA AAACTGTAGT AACCAAAGTA 540 

* 

ATTATTAGTA ACTTTATTCG TTTTCTTCTG ATTAGAATTT TGAGCTTCCA AGTTTGCAAT 600 

40 

TTTAATTTCT TTAGTAAGTT CATTGTTATT AATAACTAGA TTGTTACCTT GGCTTGAGTT 660 

♦ • 

TTTCGGAGTA TTTGAAATCT TTATATCTTG ATTAATTTCA TTTCCGTTTG AAATTGCTGA 720 

TTTGTTGTCT AACTTTAAAC TTGTGTCCGA TGTTITAACA GCACCTTCAT TTTTTATTTT 780 

4S 

GTCTTTTGTC GTATTTTTAT TAGCATTTAA CTCTGATTTC GCGAATACAT TTTGCTCATA 840 

CCCTCTTGTA AAATCTTTAG ATTTATCAAT TTCATCTGCA TATGCTTTGT TCGACATACC . 900 

CAATGCCAAA AACATACCTA TTGAAATTGA CAAAATTCCA ATACTAACTT TTCTAATTGA 960 

ATAGCGTACT TTACTTTGTT GTTTATTCAT GATGAAACAC TCCTTACAAT AATATACAAA 1020 
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.GTAGGAGGTA AAATAATTAA CTTGTCTTTC CAAAATATGA AAAGTGTACT AAAaTTCATC 1140 

GCACGACAAA TAGCCCATTT CCGATACTTT TATAAAGTAT GGAaTGGGCT ATAGCCATTT 1200 

^ ATATCATCTT TTAACTTTAT TTATTAACAG TTAATAATGA TTCATAAATA CCTGCTTCTT 1260 

TAGCAGCTTC AATTAATGTT GAACCAATTT CTGAAGGTGT TGCOGCTGTT TTCACACCAC 1320 

AACTATTTAA TGTTTTAATT TTCTCTTCAG CAGTACCTTT ACCACCTGAA ATGATTGCAC 1380 

CAGCATGTCC CATACGTTTT CCAGGAGGTG CTGTTTGTCC ACCGATAAAG CCTACAACTG 1440 

GTTTTGTCAT ATTCGCTTTA ATCCATTCAG CTGCTTCTTC TTCAGCCGTA CCACCGATTT 1500 

CACCAATCAT AACAACTGCT TTCGTTTCGT CATCTTCATT GAATGCTTTT AAAACATCAA 1560 

15 

TAAAGTTTGT TCCGTTCACT GGGTCTCCAC CAATACCAAC AGCTGTAGTT TGACCAATAC 1620 

CTTCTTCAGT CAATTGGTGC ACTGCTTCAT ATGTTAATGT ACCTGAACGA GATACTACAC 1680 

CAACATGACC mTTrGTGA ATATAGCCAG GCATAATACC AATTTTACAT TCATCTGCTG 1740 

20 

TAATCACACC TGGACAGTTC GGACCAACTA AACGTGTTTT TCTACCTTGT AAGTAGCGTT 1800 

TAACTTTAAC CATGTCTAAT ACAGGAATAT GTTCAGTGAT ACAAATAACC ATATCTAAGT 1860 

2s CTGCATCAGC TGCTTCTAAA ATTGAGTCTG CAGCAAATGG TGCTGGAACG TAAATGACTG 1920 

AAACCGTTGC CCCAGTTTCA TTTTTAGCTT CTTCAACAGT GTTGAAAACA GGAACGCCTT 1980 

CAACAACTTG ACCACCTTTA CCAGGCGTCA CACCTGCTAC TATTTTCGTA CCATAATCAA 2040 

30 GCATTTGTTT TGTATGGAAA AGGGCAGTAG ACCCTGTAAT ACCTTGTACC ATTACTTTAG 2100 

TATTCTTATC TATAAATACA CTCATCTTAG TGCTCCCATC CTTTCCTTAT GCTTCTTTGA 2160 

CTAGTTTAAC AATTTTTTGT GCACCTTCAG CCATTGTTGC TGCTGGTTCA ATTGCTAATC 2220 

CTGAGTCTTT TAAGATTTTT TTACCTAACT CAACATTTGT ACCTTCTAGG CGTACAACTA 2280 

GTGGTAAAGT TAAATCTACT TCTTTTACAG CTTCAACGAT ACCTTCTGCX5 ATAACATCAC 2340 

ATTTCATAAT GCCACCGAAA ATGTTTACAA AAATACCTTT AACATTTTCA TCACCTAAAA 2400 

40 

TGATTTTAAA TGCTTCAGTT ACTTTTTCTC TAGTAGCGCT TCCGCCTGCA TCTAAGAAAT 2460 

TGGCTGGGTT TCCACCGAAA TGATTAATCG TATCCATTGT TGCCATGGCT AAACCTGCAC 2520 

CATTAACCAT ACATCCGATG TCACCATCTA ATGCAATGTA TGATAAATCA TGTTTAGACG 2580 

45 

CTTCAATCTC TTTCXKaATCT TCTTCTTCTA AATCACGTAA TTCTACAACA TCTTTATGTC 2640 

TGAATAATGC ATTATCATCA AAATTAATTT TAGCATCTAA TGCCAATACA TCACCATCAG 2700 

CTGTTGTAAC TAATGGGTTG ATTTCTACGA TTGAACAATC TTTTTCAATG AATACATTAT 2760 

AAAGTGCTAA TAAGAATTTA GCAGCTTTGT TAACAGATTC TTTAGGAATA TTAATATTAA 2820 
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AGATCTTTTC AGGAGTCTTC GCAGCAACTT CTTCAATCTC AGTGCCCCCT TCTTCAGACG 
CCATCAATGT TACTTGGTCA GTCGCACGAT CAATAACGAA TCCAACX5TAA TATTCTTTTT 
GAATAGCACA ACCTTCTTCG ATATATAAAC GCTTAATTTC TTTACCTTCT GGACCAGTTT 
GATGTGTCAC CAAAGTTTTC CCTAATAATT CTTTTGCATA TGTTTCTACC TCAGATAAAG 
ATTTAGCAAT TTTTACTCCG CCTGCTTTAC CTCTACCTCC AGCATGAATT TGTGCTTTTA 
CAACATAAAC ATCAGAATTT AATTCTTTTG CTTTCTCCAC CGCTTCTTCA GCAGTAAATG 

• r ' 

CTACTCGTCC TTCTGGAACT GCAACGCCCA TTGAACGAAA TATTTCTTTA CCTTGATACT 
CGTGGATATT CATCTTCCAT CCTCCTGTTA CTTAGGTTAA GTTCCCTTAC AATTATAAAA 
AATGTAAGCG CTATTGTAAA CTTAAATGCT ACTTTTTTAT CATTTAATTG AATTTTACGA 
TTTACAGTAA CGATTTTATA GGTTCAAAGC TTTTTCTATG CTCTTTCATA ATGCCAATAT 
CATCGATTGC TAGTAAATGT TGTTTGGTAC CGTAACCCGC GTTTrTTTCA AAACCATATT 
CAGGATAATC TTTAGATAAC TGTGTCATAT AATCATCACG AAAAACCTTT GCCATGATAC 
TTGCAGCT6C AATGGACACA CTTCTTGCAT CACCCTTGAT TAAAGATACT TGAGGCAGTG 
CATTATCAAG CGTCATCGCG TCTATCAATA AATGCGTTGG TTGTACTGAT AATCCATCAA 
TAGCTCGCTG CATGGCGATT TGAGTAGCTT TATAAATATT AAATTCATCT ATTTCTTnCA 
GtGTCGCGAT CCCATATGCA AAAGCAGTAA CTTCATTTTT TAGTGCTTCA TTTAATTCTA 
GACGTTTCGT AACAGGTACT TTTTTCGAGT CATCAAGGCC CAAATAATTG TGATTTGAAT 
TTAAAATTGT TGCGCATGCA ACGACTGGAC CTGCTAAAGG TCCTCTTCCA ACTTCATCAA 
TCCCACAAAT AATAGCATTA GGATGCTCTT TTAATATTTC ATTTTCAAAG TAAGTCATTT 
CAACATACTT TTCTTTTAAA GCTTGTTCTT TTTCTAACGC TTTTCTGCGC CTAGCTATGG 
CATTTrGAAC ACCTTTTCGC TCATCTAAAA AGCATTCATG ATTTTCTAAT TCTTCTATTG 
TATTAACCGC ATTAATCAAC TGCGTAACTT CTTTAATTGT TAGCGTCATT TGCTAATTCC 
TCAGTCATAT CTTTAAAAAT ATCAAAACAA TAATTTCCTA TTTTAGCATT TCGAATATCA 
TAAATAATCA GTTCAATGAC TGCTTCGTAA TCAATTTCAT TACCACGTCG AATTAAGCCc 
ACGTTTTTTC CCTATCGCAT CAAACCACGC TATGATTTCT GCAtCTTCAG GAACTTCAAT 
ATTATAATGT GACTTTAATC GCGCTAAATC ATTTTGAATT AAAAAGTTTA ATCCATAGAT 
GGCAACrrCA TCTAAGTGCA CAATACTATC TTTTATCGCA CCAGTTAAAC TCAACTTCTT 
ACCGACTTCT TCATCTTCAA ATTTAGGCCA AAOTATCCCT GGTGTGTCTA ATAGTTGTAA 
TGCATTACCA ACrTTTAATCC ATTGTTGTTG TTTGGTCACA CCTGGTTTAT TACCAGTCTG 
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AACGATCATT GCTCTTATCG CTCTAGGTTT AAGTCCTTTC GCTTTTTCGC GTTCAAATTT 4740 

TTCAGCAGTC GCCTTAATTG CTGCAGCTTC CACTTTCTTT AAATTTTTAC CGTGCTTAGC 480 0 

ATCCACTGAT ACAGGATAgT AtCCTTTATC AATAAAAAAT tGTTCCCATT TTGACATCTC 4860 

ATTTAAATTA GACATATCTT TTTTATTTAA TATAACAACA CGT6GTTTTT GGTTAATAAC 4920 

TTCATCTATC ATAGGGTTTC TTGAACTATA TGGAATTCTT GCATCTACTA GTTCAAACAC 4980 
TACATCTACT TTTTTTAATT 
(2) INFORMATION FOR SEQ ID NO: 242: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1700 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNSSS : double 

(D) TOPOLOGY: linear 

20 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 242: 

AACCCGnAGA CGAAACTnCA TAGTTGCCTG TTATGTTGAT TAGTGCGTTT GTAGCTATTT 60 

25 nAAATCAAAC ATTATTAAAT ACAGCGTTaC CTAGTATAAT GAGAGAATTA AATATCAATG 120 

AAAGTACATC GCAATGGCTA GTTACTGGGT TTATGCTTGT TAATGGCGTC ATGATACCTC 180 

TGACGGCATA TCTAATGGAT AGAATTAAAA CTAGACCTTT ATACTTAGCG GCGATGGGGA 240 

30 CATTTTTATT AGGTTCTATT GTTGCAGCCT TAGCTCCGAA TTTTGGAGTT TTAATGTTAG 300 

CTCGTGTAAT TCAAGCGATG GGTGCAGGCG TACTTATGCC CTTAATGCAA nTACGTTAT 360 

TTACATTGTT CAGTAAAGAA CATCGAGGTy TtGCAATGGG ACTAGCAGGT TTAGTAATTC 420 

AATTTGCACC AGCAATAGGA CCTACAGTTA CAGGATTAAT TATTGATCAA GCGAGTTGGC 480 

GAGTTCCATT TATTATAATT GTAGGAATTG CTATACTTGC CTTrGTTTTC GGTTTGGTTT 540 

CAATCTCGAG TTACAATGAA GTGAAATATA CGAAATTAGA TAAGCGTTCA GTAATGTATT 600 

CAACTATTGG GTTCGGGTTA ATGCTATACG CATTTAGTAG TGCAGGAGAT TTAGGATTTA 660 

CAAGTCCAAT AGTAATAGGT GCGTTGATAT TAAGTATGGT TATTATCTAT TTATTTATAC^ 720 

GTAGACAATT TAATATTACT AATGCACTTT TAAATTTAAG GGTTTTTAAA AATAGAACAT 780 

TTGCATTATG TACGATTAGT TCAATGATTA TAATGATGTC AATGGTTGGA CCTGCGCTGC 840 

TTATACCGCT ATATGTTCAA AACAGTTTAT CTTTATCTGC CTTGTTATCA GGACTTGTTA 900 

TCATGCCTGG TGCAATAATA AATGGTATTA TGTCAGTTTT TACAGGTAAA TTTTATGATA 960 

AGTATGGTCC TAGACCATTG ATTTATACTG GTTTTACAAT TTTAACAATT ACTACAATTA 1020 
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GAATGTTTTC AGTTTCTTTA CTCATGATGC CGATAAATAC TACAGGAATT AATTCTTTGA 
GAAATGAAGA AATCTCACAT GGCACGGCTA TTATGAACTT TGGTCGTGTA ATGGCTGGTT 
CACTAGGCAC AGCTTTAATG GTTACATTAA TGAGTTTTGG TGCAAAAATA TTTTTATCTA 
CATCGCCATC GCATTTAACT GCAACTGAAA TTAAACAGCA ATCCATTGCT ATAGGGGTGG 
ATATCTCATT TGCTTTTGTA GCTGTGCTTG TTATGGCAGC TTATGTGATA GCACTTTTTA 
TAAGAGAACC TAAAGAAATA GAAAGTAATA GAAGGAAATT TTAAAATAAT TATAGTAGTT 
GGTCTATTTA AAATAATAGG CTAACTGCTT TTTTTATTTA ATAAAAAGTT TTATACTTTT 
AGTGATAGAC TAAGCAAAAA TTGTTATTTG CTATGATGTA GATGTCTTAA AATGATTAAG 
GGGGATTTGC TTTGTTAACG GTAGATCAAG TGAAAGAATT GGTAGGAGAA ATTAAAGATC 
CTATTATAGA TGTGCCTTTA AAAGAAACAG AAGGTATTGT TGAnGTTTCT ATTAAGGGAG 
AAnAAGAACA TGTGAGTGTT 
(2) XtTFORMATlON FOR SEQ ID NO: 243: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 10146 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 243: 
TGCATCAACT TTCAAACAAT AAATCATCAC AATAACCACA CCTAATTCAA CACTTTTCAA 
ACATAAGTAT TGACACATTG AGCAAAATGA TTTTTAATTG TAACTAATAC AGTTACAATT 
ATGAGGTGAG AAACATTGAA TTTAGAATTT AACATTGCCG TGCATGTATT AGCTTTTTTA 
ACTAAGCATC aTTCAGAAAA ATTCAATAGT AGTTCATTAG CAGAaTTAaC TTGTTTAAAT 
CCTGTTCAAT. TACGACGCGT GACGACTCAA CTTGTCGATT TAAAAATGAT TGACACAATA 
CGAGGTAAAG ATGGCGGTTA TTTAGCAAAT GATCAAAGTG CTGATGTCTC TCTAGCAACA 
TTATaTAAAC ATTTTGTCTT AGAGAAAGAA CACCACACAC GTCTATTTAC TGGCGACGAA 
GGCAGTCACT GTCAAATTGC TCGTAATATT GCAACTACCA TGTCACATTA TCAGCAAGAC 
QAACAGAATA TCATTATTAA TTTTTATAAT GGAAAAACAA TCAAAGATGT CATTGAAGAC 
ATTCAAAAGG AGGATTTATG TCATGAAAAC ATATGATTTA ATTGTAATAG GATTTGGGAA 
AGCTGGTAAA ACTTTAGCGA AATACGCTGC ATCAACAGGT CAAOICGTCG CAGTTATCGA 
ACAATCTCCG AAAATGTATG GAGGCACTTG TATAAACATA GGATGTATAC CTTCGAAGAC 
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TGTTGTCAAT GCGCTAAACA ATAAAAATTA CCACTTATTA GCAGACGATA ACAACATTGA 840 

TGTACTGGAT TTTAAAGCGC AGTTTAAATC TAATACTGAA GTGAATTTAT TAGATCAACA 900 

TGACGATATC GTCGATAGTA TTACTOCACC TCATATCATT ATTAATACCG GTGCTACCTC 960 

TGTCATTCCT AACATTAAAG GCCTTGATCA AGCTAAACAC GTCTTCGATT CGACAGGTTT 1020 

ATTAAACATT AGCTATCAAC CTAAGCACCT CGTTATTGTA GGTGGCGGTT ATATCGCCTT 1080 

AGAATTTGCT TCAATGTTTG CGAATTTAGG TAGTAAGGTA ACAGTATTAG AACGTGGCGA 1140 

ATCATTTATG CCACGCGAAG ATCAAGATGT CGTTGCATAT GGTATTACTG ACTTAGAAAA 1200 

TAAAGGCATT GCATTGCATA CAAATGTTGA AACGACTGAA TTGTCATCTG ACAATCATCA 1260 

TACAACAGTC CATACCAACG TTGGTAACTT TGAGGCTGAT GCAGTACTTT TGGCTATCGG 1320 

GCXXAAACCG AATAGGGATT TAGCTTTAGA AAATACTGAT ATOGAATTAG GCGACAGAGG 1380 

CGAAATTAAA GTCAATGCTC ATCTTCAAAC AACTGTGCCG CATATTTATG CTGCAGGTGA 1440 

TGTTAAAGGC GGACTTCAAT TTACGTATAT ATCTTTAGAT GATTATCGAA TTATCAAATC 1500 

AGCGTTATAT GGTAATCAGT CACGTACGAC TGACAATAGA GGCAGCGTGC CTTATACAGT 1560 

25 ATTTATAGAT CCACCATTAT CACGTGTTGG ATTAACTAGT AAAGAAGCTG CCGCTCAACA 1620 

TTATGATTAC ACTGAACATC AACTTTTAGT AAGTGCTATA CCTCGTCATA AAATTAACAA 1680 

TGATCCAAGA GGTTTATTTA AAGTAGTCAT TAATAATGAA AATAATATGA TTTTAGGTGC 1740 

TACATTATAT GGTAAGCAAT CTGAAGAATT AATTAATATA ATTAAACTTG CGATTGATCA 1800 

AAACATTCCA TATACCGTAT TACGAGATAA TATTTATACG CATCCTACGA TGGCCGAATC 1860 

ATTTAATGAT TTATTTAATT TCTAGACAAA ACATAAAAAC CTGGTGGCAC GCATTGAATG 1920 

ATGCTGCCAT CAGGCTTTAT TGTTGTGCTT TTCGCTTTTC TAATTTTTCT TTAAGCTTTC 1980 

TATCFTGTTC TTCTTTACGA CGTTTACGTT CTTCATGTCG TTTTCTTAAA CGCTCTTCTT 2040 

CTTCAGGATC ACGTGGTTTC TTTAATTGTT GAGAAACTTT TTCGATTAAT TCTTCTTCAG 2100 

TAAGCGCagc CAGTGGGCGG TTATTAACAA AAGTGAATGT TTTTCGGCGT CCAGGTCCAC 2160 

AATAAGATTG ACAACCTATC ACGATTTCAG CATCGGGATC TAATTTTTCC AACTTCTTTT 2220 

GTAACGTTCT TATATTGACT GCCTGACATT CATCACAAAT AAGGAATGTA TTTTTCATAT 2280 

TGCTACCCAC CTTTCTTTAT CATATCTATA TCGTCGATTT CATTAATTTT TTCGTTAACT 2340 

CTATCTATTT TACTCTTTTT AATATTTTTT TCAAGATACG TAACACGGCT GaCAATAAAA 2400 

AATGGAGCAT TTATCTTCTA ATTAAATTAG ATGaTTGCTC CCCTATCAAA TCATTTATTG 2460 

CCCATGATAA ATATTAAATT TTAATGGTTT AATACCATGT TTTGTCCATT CATCATAAAT 2520 
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TGATGTTTTA GATGCGCCGT GATACTTTTC AGCAATATCA CACAAATATT TTAGCTTTTC 2640 

AGTTTCTATA TCAACTGTAG CTTCTTTATC CATACGTTGA ATAATTOTAC GATTCTGACG 2700 

CACCATCTTT TGCACACCTT TAATGTTATT TGTTTTAAAA GCATGAATAA GTTTTTCAAC 2760 

ACAACGATGT GAATCTTCTA AGAAGTCACC GTAAAATGAA GGATCTGATT rCAAACGTTT 2820 

CACTTCGCTA ACAAAGTGTG GTGATGACGC CGGTGAGCCA GTCCAACCGA TAAGTACTTC 2880 

CATATTTTCA GGTGCTTGTA ATGGTTCGAT GTGCAATCCA GGCCAGTTTT TGATTAAAAC 2940 

TTCTTCAACC GTAGTATCTT CAATTTGATG CTTAACCCAT TCATGATCAA AAGTACTATA 3000 

CGCTAGCCAT CCACTATATA CACTCACAGC AATATCTCCO CATGAACTTA AACrTTGTAA 30S0 

CTTCATATTT GCAATCACTG CTAGTTTATA AATGTATAAA TTAGATAACT TCATATCATA 3120 

AAATTCATTT AATACTTTTA TAACTGACAC AAGTACTGCT GCACTTGAAC CTAATCCATA 3180 

TTTATGACCA TTTGAATCAT CTAAATTACT ATCAATAGTC AGATGAAAAT GCTTCATCGC 3240 

TATATCGCAA CTTTTCGCGT ATTGTTCAAA TATTTCAATA GCTGTGaCCA CATAATTTAA 3300 

TTGTTTTGCT GcATGTGGAT CTGAAATGAC AATACTATCT TCATCTCTAC TAAATGTAAC 3360 

TGGGTTATGA TGTAATGCTT TTGAATGAAT GGTACCTTTA TATTGGTCTG CTTCTTCAAT 3420 

AGTAGCAGTT ACAAAACGAT CTAACGCAAT AAGXACAGAT TTATATCCTG GTTCT6TTAC 3480 
AGCATATTCT CCAGCAATAT AAAGTTTTCC GGGTGCTTTG ACCTGAATCA TTTTATCTCT - 3540 

TCCTTACTCA ATTATTTCAA TTCCTGTGGC AATAATGTCA CTATCAATAA TTTGGTTATT 3600 

ATCAAACTGT GTTAATAATT TATCTATAAT CTGTTGCTTG TT T TrCT m' CTACAAGTAT 3660 

TTTCACATTA GGTCCCGCAT CCATTGTAAA ATAACACGGA TACCCCGCTT CTCGGCATTC 3720 

GTGAACAAGC GCCATGACAT CATAACTTTC TTGCACAAGA TATGTGAACG GCGGTGTTGA 378 0 

TCCtSiGATTC GTGGCATGCA TACGCAAACC ATTTTCTTCA ATTACXTCAC CAAGGCGTTT' 384 0 

AAAATCTTTG TCTTGAATCG CTGCTTTTGC TTCAGCTAAA XCTTCATCAA TATGATCTAA 3900 

CCAATATTGA TAAAACCTTG ATGTGTTTCG TGTCAATGAC ATACCATATC GACTAGGTAC 3960 

CTTTTTAGAA TGTTGATTAA TCACAACAAA TATCATGGCA AGGTCATCTT CAAAATGATT 4020 

CGATTCAAGT GGAACGGCAT ATGACGTCTC ATCACTATAC CCTTTTTCCC ATTCTGCAAA 4080 

TCCACCATAA ATACTACGCG ACGCAGAACC CGAACCAATT CGCGCCAATC TCGATAAATC 4140 
CTTATCTGAC AGCTGCATGT CTAGCGCTTG ATTACAAGCT GCTGCTAAAG CTGCATATGC - 4200 

GCTTGCCGAT GAAGCCAACC CTGCTGCTGT TGGTACAAAA TTGTCGCTTT CAATTTCTGC 4260 

ATACCAATCG ATGCCAGCTC TATTTCTGAC AATATCCATA TATTTTGAAA TTTTCTCTAA 4320 
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AAAAGTGACT rrCGTTTCAG TGTAAAATTT TTCTAATGTA ACAGATATGC TATTATTCAT 
TGGAATGATT AGTGCTTCAT CTTTTTTACC CCAATATTTT ATAAGTGCAA TATTCGTATG 
TGCACGTGCT TTGCCACTTT TAATCAACGC ATTAACCTCC TAAATTCTCA ATCCAAGTAT 
GTGCTGCACC AGCTTTTTCT ACAGCTTTTA CAATATTTTT CGCTGTTGGT AAATCTTTGG 
CAAGCAATAA CATACTTCCA CCACGACCAG CGCCAGT7AG TTTTCCAGCA ATCGCACCAT 
TTTCTTTACC AATTTTCATT AATTGTTCTA TTTTATCATG ACTAACTGTC AACGCCTTTA 
AATCCGCATG ACATTCATTA AAAATATCCG CTAAGGCTTC AAAGTTATGA TGTTCAATCA 
CATCACTCGC ACGTAAAACT AACTTACCGA TATGTTTTAC ATGTGACATG TACTGAGGGT 
CCTCACAAAG TTTATGAACA" TCTTCTACTG CTTGTCTTGT TGAACCTTTC ACACCAGTAT 
CTATAACAAC CATATAGCCG TCTAAACTTA ACGTTTTCAA CGTTTCAGCA TGACCTTTTT 
GGAACCAAAC TGGTTTGCCT GATACAATCG TTTGCGTATC AATACCACTT GGTTTACCAT 
GTGCAATTTG CTCTGCCCAA TTAGCCTTTT CAATGAGTTC TTCTTTCGTT AATGATTTCC 
CTAAAAAATC ATAACTTGCA CGAACAAAAG CAACCGCGAC AGCTGCACTC GATCCTAATC 
CACGTGATGG TGGTAAATTC GTTTGGATCG TTACTGCTAG CGGCTCTGTA ATATTATTTA 
ATTCTACAAA ACGGTTCACC AAAGACTTAA GATGGTCAGG CX5CATCATAT AACATACCAT 
CGTAAACATC GCTTTTAATA GACGAATAGT TCCCGCTCTC TAAGGCTTCT ATTAAAACTT 
TGATTTTACC TGCGTTAAAC GGTACTGCAA TAGCAQGCTC TCCAAATGTA ACAGCATGTT 
CTCCTATTAA AATAATCTTA CCTGTCGATT CCCCATATCC TTTTCTTCTC ATGTCAATAT 
CACCTTTTAT ATTTATCCTA TACTTGATTC ATTATTTTTA TTTATTAGTA AAAGACATCA 
TATTCTAAGT TGCAtngCAT TCGCGTTAAA TTTCATTGCA GTCTTTATCT CACATTATTC 
ATATTATGTA TAATCTTTAT TTTGAATTTA TATTTGACTT AACTTGATTA GTATAAAACT 
AACTTTCGTT TACTTCAAAG TTTAAATCTT ATCGAGTGAT ATTTCAGATT CTTTATCTTT 
TTATAAAATA GCCCTACAAT TTATAATTTT CCACCCTAAC TATAATACTA CAAATAATAA 
TTGGAATATA TAGATTTACT ACTAAAGTAT TAGAACATTT CAATAGAAGG TCGTTTCTTT 
CATAGTCATA CGCATTATAT ATACCCTATT CTCAATCTAT TTAATACGTA AAACATGAAA 
TTTTCTTATT AAATTTATTA TTTCCATCAT ATCATTACTT TTAATTTAAT GATGTTCAAT 
TTAAATATTA GGTCAATAAC ATATTTATGC TTTTTATGGA TACTTTCAAA AATAACAGCC 
CCAAACGATA ACTTGAAAGG GGCTGTTAAA TATTTAACTA TTGCATTTGA TCTATCATTT 
TCTTGTTTCT TTCAATCATT TTATCAAAAT ACGTATCGTA TCTTTGCCAT TCTTCTTGAG 
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TTACATCTTG AACAGTAATC GTTTTGTTAA . GCAATGTCTC TAATGAGGCC ATACAAGATG 
GTTCAATTTC AGGATATTTA AATTTAGTCA CTTCACCTTT TAAAGCATGT TCATAAAATG 
TTTGCATCAT CAATGCACGT TCTGAACCAG AGCCTTCAAC ACAAAGATAA ATTTGTACAG 
CAATACCGCC TCTAACTCTT CGTTGCGATA TGCCTGCAAA TTTCTTACCA TCGATACTTA 
AGTCAAATTT TCCTGGGCAA TAAGAATGTT CAATTTCCAT CGTATCAATA TCAACATTCT 
CATTTTCGAA CATTTTGCTA ATTAAGAGGT ACATCACAGT AAACGCTTCA TCAATCGTTG 
TTTCTGTTTG TCCTTTGAAC ATCAGCGATA TATTTAATAC ACCTTGATCT AGAACGACAC 
CTAAGCCACC AGAATTTCTA ACAATGGCAT TATAACCAAT CTCATTCGTT AAATAATCAA 
TGCCATCTTT TAAAAACGGC AATCTTGAAT CATGAATACC AAGAATAACA GTATGTTGAT 
GAATCCAAGT ACGCACAACA TTATCTGATA TATCTTTGCC CACACTTTCG CAAAATGTAT 
CATCGAATGC GAAAGATTGC ATAGGTTCTA ATCCAGAAGA ATGATCGATA TATCGCCAGT 
TGACGCCATT AAAATATTTA CTCGCTAAAT CCATCGTTAT TGTAAGGCTT GCGCTGCTGT 
AATAATT6AA AGATT6TATA CATCTTCAAT TGAGCAGCCA CGTGATAAGT CATTTACTGG 
AGAATTTAAA CCTTGTAATA CTGGACCAAC TGCATCATAT CCACCTAAAC GTTGTGCAAT 
TTTGTAACCA ATATTACCAG CTTCTAAACT TGOGAATACA AAGACATTTG CATCACCTTG 
TAATTTAGCA CCTGGCGCTT TTTTCTCAGC AACACCTGGT ACAATCGCAG CATCAAATTG 
GAATTCGCCA TCAATGATTG CTTCTAATTT TtCTTCTTCA GCTTTTtGTT GTGCTAATTT 
GACAGCTTCT TGAACTTTTG TCACGTCGTC TGATTTAGCA GACCCTTTTG TTGAAAAGCT 
TAACATTGCA ACTTTTGGAT CCATGCCAAA GCTTAATGCT GATTTTGCAC TTTCTACTGC 
AATTTCTGCA AGTCCTTGTG AATCAAGTTC TGGATTGATT GCACAATCAC CAAAGATGTA 
TTGrrCATCA CCTTTAATCA TAAAGAAGAT ACCTGATGTT CTTGATACAC CTGGTTTCGT 
TTTGATGATT TGTAAAGCTG GACGCACAGT GTCGCCTGTT GAATGTGCTG CACCACTAAC 
TAAACCATCT GCTTTACCAG CATAAACAAG CATTGTACCG AAGTAGTTCA CATTGTTTAA 
TAATTCTTGT GCTTGTTCTT CAGTCGCTTT ACCTTTACGT CGTTCAACAA ATGATTGAAC 
TAATTCAGCT TTCAATTCAC TTGTCGCAGG ATTAATTAAT TCAATATTAG AAATATCAAG 
ATCAAGTTTT TGCGCTAAAG ATTGAACCTT AGTCTCATCA CCTAACACGA TTGGTGTAAC 
ATAATCTGTT GCTTGTAATT GTGTTGCAGC TGTTAGAACA CGTTCGTCCT CTCCTTCAGG 
TAATACGATT TTAACGTTTT TACCAGAAAG TTTGTCTTTT AATACATTTA ATAAATCAGC 
CATAATGTCC TCCTGTAATA TAAATCTTAT TAATCATTCA CGGTATAATT ATACGCCATT 
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TATGATAAAA TTTATAAAGA ACTGATGATT TTTGAAAAGG AGCGATAAAC ATGAGTCAAG 8040 

CAGCCGAAAC ATTAGATGGT TGGTATAGTC TACATTTATT TTATGCAGTT GATTGGGCAT 8100 

CATTACGTAT AGTTCCAAAG GACGAACGCG ATGCACTTGT CACTGAATTT CAATCATTTT 8160 

TAGAAAATAC AGCAACTGTA AGATCATCAA AATCTGGTGA TCAAGCTATT TATAATATAA 8220 

CTGGTCAAAA AGCAGATTTG TTATTATGGT TCTTACGTCC TGAAATGAAG TCTTTAAATC 8280 

ATATTGAAAA TGAATTTAAC AAATTGCGCA TTGCTGACTT CCTAATCCCT ACATATTCAT 8340 

ATGTATCAGT CATTGAATTG AGCAATTATT TAGCTGGTAA ATCTGATGAA GATCCTTATG 8400 

AGAACCCTCA TATCAAAGCA AGATTATACC CAGAATTACC ACATTCTGAT TATATTTGTT 8460 

TCTATCCAAT GAACAAACGT CGTAATGAAA CTTATAACTG GTACATGTTA ACTATGGAAG 8520 

AACGCCAAAA ATTAATGTAT GACCATGGTA TGATTGGTAG AAAATATGCT GGCAAAATCA 8580 

AACAATTTAT TACTGGTTCT GTAGGGTTTO ATGATTTCGA ATGGGGCGTA ACATTGTTCT 8640 

CAGATGACGT ATTACAATTC AAAAAAATTG TATACGAAAT GCGCTTTGAT GAAACAACAG 8700 

CACGATACGG TGAATTCGGT AGTTTCTTTG TAGGACATAT TATTAACACA AACGAATTCG 8760 

2S ATCAATTCTT TGCGATTTCT TAATACATTG GTACGTTTAT AAATTAATAA AAAAATTCCA 8820 

AGCTTATCGG TTTAAGCTTG GAATTTTTCG TTTATCTTCA GTATATTCCC GTATACATAA 8880 

GACGTGATTT GGTAAATAGT TGAAATCTGT ATGTTTAAAC TTATATATAT GTGCTAATGT 8940 

ATTATCAATA ACAAAGCACA CTTTGCTCAT AGCAAgTsaC CCGAgTAGTC TTCCTTGGGA 9000 

GAACTTTAAC TACTATCACT ACATATAAAC GTTAACCTCA ATAGAAATTA TACAGTCGCT 9060 

ACTCTATACA ATTTTTGTAA TGGTTAACTA ATATTATTTT AACCTATTTG AAATATTTGA 9120 

AACATATTTT TGTCGAATTT TTTTCAATAA TTTTTCCTTT TTATACTTCA AGAGAATTTT 9180 

AACTACTAAA AATTCCGATG ATTATTATTA CAATAGTATC AAATATTAGT TTTTTAAAAT 9240 

CAATAACAAC TTATCAAAAA GCTCATGTGG TTATTrTATA GTGTATAAAC TATAATGAGT 9300 

ATTAAATTCT TATAAACAAT GGTGATGAAA TGGACATAAA TTCAGAAGAA TACAAACAAG 9360 

AGGTACTTAT CAAAGACGTT GTCATGCTTG CTGCTCGCAT ACTATTAGAA TCTGGTGCAG. .9420 

AAGGTACGCG TXjTAGAAGAT ACCATGACAC GTATTGCAAA AAAACTTGGT TACAGTGAAA 9480 

GTAACAGCTT TGTTACAAAC ACTGTCATCC AGTTTACGTT ACATTCGGAA TCGTTTCCTA 9540 

GAATATTTAG AATTACCTCT CGAGATACAA ACTTAATAAA AATTTCTCAA GCTAATAAAA 9600 
SO TTTCGCGTCA AATTACAAAC AATGAAATTT CTTTAGCCGA AGCAAAAACG CAACTTGAAA . 9660 

AAATATATGT TGCTAAGCGT GACAGCAGTC TTCCCTTTAA AGGTTTTGCT GCAGCAATGA 9720 
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XAGCAGGTAG TCTAGGATAC CTAGTCACTG AGATTTTAGA TCGTAAGTwA CACGCACAGT 
TTATCCCAGA ATTCaTTGGT TCaTTAGTTA tTGGGATTAT CGCCGTTATT GGACATACAC 
TTATTCCAAC AGGTGACTTG GCAACTATTA TCATTGCGGC AGTCATGCCT ATTGTTCCTG 
GTGTATTAAT AACAAACGCA ATACAAGATT TATTTGGTGG ACACATGTTG ATGTTCACAA 
CGAAATCATT AGAAGCATTG GTTTnGCGTT TGGCATCGGT GCTGGCGTTG GTAGCGTATT 
AATTTTAGTA TAGGAGTATC AGACTATGTT TTGGATCTTA AACTTTATCT TTAGCmTT 
AGCTTC 

(2) INFORMATION FOR SEQ ID NO: 244: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2022 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 
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(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 244: 
ATTTAATTGG TTGGTGGCGT ATTCTCnTTT CCAAGATTTG CCACGATTGG ATGTTGAGTC 
GACAAATATG TAACCAGTCC CGATAAATTA CGTTCCTCAA TCATTGATAG TATGTCTGGT 
GTTTGTAACG ATTTATCGAG TAAGGCATCA AGCAATTGAT AATGTCCCAA TACAACAAAA 
TGCACGTTGT CTCTCAACTG CTGTTGAATA AACTGAATAA AGAGCTTTAA GCTCTGTTGC 
ACATTCGCTA ATGATGGTGC ATAGTTTTCC AAACCAACTT GTACAGCCGC TTCATTATTC 
CGAATGATTA AACCTGTGTA TGCCACTTTT GTTGCTGCAG TTGGATACAT TGAGTAATAA 
CGCAATAATF GATCTGTAAA ATCATTTCGA AGTGCATAAA TTTGATGCTC ATGTTGCCAA 
AAATttCGCT CACCCATCTG CTgCAAATCC TCATGGTTCA ATTGTTTCCA GTCCAACTTT 
TCAACCACAC TAAAATCAAC TAACTCATAA TCCGCTTTAT TAAAATATTT TAAAAATGCT 
GTTTCCGATT CTTTTAACGC AATTAATTGT TCTGnATTAT TCACTCGACC ACCCTTTACT 
TTCAATACTG TATTTAAAAT CACTTGGTAT TTTCGTTGTT TGCTTTACTT CTCTACCACG 
CTAAAGTGTA ATATGATTAA TAACTTATCA TTTTTAGCAA TACATTACAA CCTTTTTCAG 
AAAATTCGGT GTATTGATTT TAAAATTTTT TAAAATAnAA AAGGCAAGAC ATTTGTGCCT 
ATAAAAATGC TTAACCAAGA TTTTTATATT GaAGTTGTAC TTCTTGCACA TATTGTCCTT 
GCCTTATTAT GTAAAGTTAT TTTCTTTCTA TCTTTTTATT AAATTTAACT ATTCTTCATA 
ATCCCGATTC CCTTTAAAGT AACGTCTATC TTGTTTACTA TATACATTTT CAGGATTAAA 
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TTGGTAAACG TTCGTTGCTG ATATATCTGT AAAATTGITT GGACCGACAC CTGCAATAAA 1080 

CITAAACTCr GCTTCATCTA CCAAATAATC ATACGCTTGT GTATGTCTAT CCTGTGCGCC 1140 

ATGTGGAAAT ACAAACATAT CTGTTTTACC TACAATTGGT TCAACTTCAT CTTTCCATCT 1200 

TTTAGTATCA CGTTTAATAC CTTCTAAAGA TGTTTrTTCA AAATTAATGT GACCATATGA 1260 

ATGACTCGCA AATGACCATC CATCCCGTTT CATTGCGCGA ACAACTTCCT CAGCTGCCTT 1320 

TTTATTCTTT GTATAATCTT TACTCGTTAA TTCATTCGTG CGATAACCTA ATAOGCCCTC 1380 

ATAACCGGTT AAAGCAACAA CACCnTTTC ACCATTTAAA GAAAAATCTG GATGCTCTTT 144 0 

TACAAATTTA TTTAAAATTG GCACGATATC ATTGTCATCA GAATAAGTAG CATGGCCTTT 1500 

TTTGTCTGTA GTTTCAGAAA CAACATGTTT ATTTTTATCG AGTACTAAAC GGTCAGCATA 1560 

ACCATGGTGT CTCATGTAAC TATAGTAATT CATATCATCA ATTGAGATGA TTAGTGGCTT 1620 

20 TTTACCTTTC GGCAATTTTA TTTTTTTGGC TTTTACATGA TGAGATGATA AGTCGTATAC 1680 

ATCATGTGGA TTAACGATGA TGTAATTATT TTTATATAAT TCGTTCAATG ATTTTTTAAA 1740 

TTCACTTACA GTAATCATCC AATCATTGTT GCCCTTAGCT TGGTGTGTAT CTCCTGTAAA 1800 

25 CGCAACTTTT GGGTCTGTAA TTAATGGGTG ATAAAACACA TGATAAACTT GGCCGTGATA 1860 

TGTTTCCCAA TGTTCATCCA TTTTcGATTT aTGCTTTGCA TACTCATTTG GATTAACAGA 1920 

TTTATTkTGA GCTTTCTCAT TTTGCTTGGA ACAGCTATAT tnACAATGCAA CTGATAATAA 1980 

CAGAAAAAAT AGCAATAAAT ATTTTTTATG CATTAAACAT TC . 2022 

(2> INFORMATION FOR SEQ ID NO: 245: 

(i) SEQUENCE CHARACTERISTICS: 
35 (A) LENGTH: 1340 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

* 

40 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 245: 

ATAGAGTGAT AAAGGATGGT TGTCATATGA TAAATGCAGT AGTAATAGCA GTAATTTTAA €0 

TGATTGTGCT ATGTTTATGT CGATTAAACG TnTTATTAAG CTTATTTATC AGTGCGCTAG 120 

TTGGTGGCTT AATTTCAGGC ATGAGCATTG AAAAAGTTAT AAATGTATTT GGGAAAAATA 180 

TAGTCGATGG TGCTGAGGTA GCATTAAGCT ATGCTTTATT AGGTGGATTT GCAGCATTAA 240 
SO ' TTTCATACAG TGGTATCACA GACTATTTAG TAGGAAAAAT TATAAATGCA ATTCACGCTG • 300 

AAAATAGTCG ATGGTCAAGA GTTAAAGTCA AAGTGACAAT AATCATTGCA TTATTAGCTA 360 
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CACCATTGTT AAGTCTGTTT AATGACTTAA AAATAGATAG ACGTTTAATC GGTrTGATTA 
TCGGTTTTGG TTTATGTTTC CCGTATGTGT TATTACCATA TGGATTCGGT CAAATTTTCC 
AGCAAATTAT TCAAAGTGGC TTTGCAAAGG CAAATCACCC AATTGAGTTT AATATGATTT 
GGAAAGCAAT GCTTATTCCT TCAATGGGGT ATATTGTTGG CTTACTTATC GGTTTATATG 
TATATCGTAA ACCACGTGAA TATGAAACAC GTAAAATTTC AGATAGTGAC AATGTTACAG 
AGTTAAAACC ATATATCTTA ATAGTAACAA TTGTAGCAAT ACTAGCTACA TTTTTAGTAC 
AAACATTTAC AGATTCAATG ATTTTTGGTG CACTGGCAGG GGTACTCGTA TTCTTTATTT 
CACGTGCATA TAATTGGTAT GAATTAGATG CTAAGTTTGT TGAAGGTATT AAAATTATGG 
CTTATATTGG TGTAGTTATT TTAACAGCAA ATGGATTTGC TGGTGTAATG AATGCTACTG 
GTGATATAGA TGAATTAGTT AAAACTTTAA CAAGTATTAC TGGTGATAAT AAATTATTTA 
GCATTATCAT GATGTATGTG ATAGGTTTAA TTGTCACTTr AGGTATTGGA TCATCATITG 
CAACAATTCC TATTATOGCA TCATTATTCA TTCCTTTTGG AGGGTCAATT GGACTAGATA 
CAATGGCATT AATCGCATTG ATTGGAACAG CGAGTGCATT AGGT6ACTCA GGTTOGCCTG 
CAAGTGATTC AACATTAGGA CCAACTGCGG GATTAAATGT TGATGGCCAm CATGATCATA 
TACGTGATAC ATGTGTACCA AACTTCTTGT TTTATAATAT TCCTTTAAAT GATTTTCGGT 
ACTATTGCTG CTATGGTACT 



480 
540 
600 
660 
720 
780 
840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1340 



30 



35 



(2) INFORMATION FOR SEQ ID NO: 246: 
(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3365 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : doixble 

(D) TOPOLOGY: linear 



40 



45 



50 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 246: 

CAAAATCTAA GAGAATAAnA TTTGTTAATT TnAAATAGCA AGCAATTCAA AGTTATATGT 

GTAATAGATA AAATAGATAT CCCTATAGTO ATGCGTTACT AGCTAAACAT AATAACACAT 

» 

TAGAAGATAA TGAAGTTAAG GAGTTACTGG ATTGTTTCGA CTATGTAATT AAGTATAAAA 
ATATCCAACG ACAAAACGTA ATTATAAAAT GGTAAAAGCT ATGGTACAGT TTCAAATTGC 
TAATGACATG CGTATCGGTG AGCTACTTGC AATAAAGAGA GTAAATATAA ACTATGAAGA 
TAAAACGCTA GATATCGACG GTAAAGTTAA TTGGATAACT GAAAAAAGAC GGGAGCATTC 
GGAGTAAAGG AGACAACTGA AAGAAGTAAT AGCTATAAGG CCACAGGGCT CACTACCCAA 



60 
120 
180 
240 
300 
360 
420 
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T ATTCACAAA 


TACGTCTGGT 


AGCCCTATCG ACTCGAACAA AATTAGCCAC 


ATTATTAAAG 


540 




GGGGGCGCTG 


ATATTAGTTC 


TATTAAGAAA CCTATAAOGA 


CGCATACATT 


ACATCATTCG 


600 


5 


CATATATCTA 


CACTTGCTCA 


ATTAGGAATT AACTTAAAAG 


CAATGCAAGA 


GCATGTAGGT 


660 




CATTCAGATT 


ATAAAArAAA 


TCTAGAGATA TACACACATG 


TTACTAATCA 


GATGGCGAAA 


720 


10 


GATATGATGA 


ATAAATTTGA 


ACGATTGGGG AGTTAAAATT 


GGAAAAAGAT 


GaTACACTAG 


780 


CAGAAATTAA GCCTATGCTC 


AATTTTGATG AGCAAATAGC 


AAAATTAAAA 


CAGATGAATA 


840 




TATTTTTTAA TATTATTGAC 


ACCGAAAAAG CAAATGAAAT 


TCTTAGAAAA 


AATAATTACT 


900 


IS 


TCTTCAAACT wGcTTATTTC 


CGaAAAAATT TCGrAAAAAA 


GaATGGCGGC 


TATTTCATAG 


960 


AATTTGCTTA TTTATCAGAT 


TTAGCAACTA TAGATATGaA ATTAAGATAC 


ACAATGTTGC 


1020 




ATTTAACTTT 


AGATATTGAA 


CATAGTTTAA AGTATCTAGT 


CTTAAAACTA 


ATAACAGAAA 


1080 


20 


ATAACCAAGA 


AGATGGTTAT 


AAAATAATAG ATGAGTTCTT 


ATGTATTGaT 


AAATCATATA 


1140 




GCAATTCAAA 


TTTTGACACA 


AATTCAAGAA CACCAGAAGA 


AGTTATGGAA 


ACCAAAATCA 


1200 




AAAATAAAAA 


CGAAATATTC 


AAGCATATGA ATAAACGAGG 


ACAACTACCC 


GAGAAGTTGa 


1260 


25 


ATAAATACTA 


TCmAAATCCA 


CCCGCnnGGk TTTGCaTTGr 


ATTCATGCAA 


CTAGGTCAAT 


1320 




TCGTTTCGTT 


TCTCAACTTC 


TATTACAAGA A^TACAATGA 


CGAAGAATTG 


AGAGTTGCTA 


1380 




ATATlTrAAT 


GCCTTTAGTT 


AAAAATATAA GAAaCAAATC 


AGCTCATAAC 


CAACCCATCA . 


1440 


30 


TAGCAAATCT 


AAATTATGAC 


AGTAGATTAC CTCAATATTT 


ATTTGAAAAA 


GGGAATAATA 


1500 




TAGGCATATC 


TAGAAACATG 


TTCGGAATAA AAAATTTCAT AGATACTkTC 


• 

ksTACGCTAG 


1560 




AATTACATAA 


TCAAGTTTGT 


AGTAATGCAA TTATCCAAGC 


AAGATATCAC 


GATTTGGACC 


1620 


35 


AACTTCAAAA 


GCGATATAAA 


AGrAACGrAA GCTATTATAA TAATGCATTA 


GCTATCAAAA 

* • 


1680 




GATmTTAT 

* 


AGCTTTAGAT 


AAAATTATTG ACTTCAACAG 


ACCAAAAGTA 


TAAACTATCT 


1740 


40 


AGTGAGGAAA 


GAGACTTATA 


GGTCTCGCGA CTTATiTIAA 


TTCGTATGCA 


AGAAAAAGAA 


1800 


GAGCTATGCA 


TTTTATTTAA 


AATGCGTAGT TCTTtTTTTA 


TGCATCTAAA 


TTCATATTAT 


1860 




TTTTGCAATA 


TAAACATATC 


TTTGTGCAAA TTCCXJAACAC 


AAAACATTCA 


CATCATCCTT 


1920 


45 


TTTtC5CCCTT 


TTTCTATACC 


CCAAAACACA AAAAGCCCCG 


TAAGCCTATG 


CcTACGGGgT 


1980 




TTGACAATAA ATTATATATT 


ATTGTTCTTC TTTAACATAT 


GGTAATAATG 


CCATATGACG 


2040 




AGAACGTTTG ATAGCTGTAG 


TCAaCATACG TTGATATTTA GCTGAAGTAC 


CAGTTACACG 


2100 


SO 


ACGTGGTAAA ATTTTACCGC 


GTTCTGAGAT AAAACGTTTT AATAATTCAG 


TGTCTTTGTA 


2160 




GTCGATATGT 


GTAATACCAT 


TTGCTGTGAA ATAGCATACT 


TTTTTACGAC 


GACGTCCGCC 


2220 
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10 



IS 



20 



25 



30 



35 



40 



CGTTAATTTT TATTAGAATG GTAAGTCATC ATCACTTATA TCAATCGGTC CGTTTGCATT 
TGCAAATGGA TTATCAGATT GTTrCGTGTT TGATGAATTA TTGTACGAAT TGTTTTGTCC 
TGATTGTTGA CCACCGAATC CTTGACCGTA ATCTTGGAAT TCATTTTGTT GACGTTGGCC 
ACCATTTTGT TGCGCATTTT TAGGTTCAAG GAATTGAACG CTATCACACA CAACTTCAGT 
AACAAACACA CGACGACCTT CTTGATTTTC ATAATTACGG GATTGTAAGC GACCATCTAC 
ACCAGCTAAA CTACCTTTAG ATAAATAGTT ATTTACATTA TCTGCTTGTC TTCTAAAAAC 
AACACAGTTA ATAAAATccG CtTCGCGCTC CCCTTGAGCA TTCGTGAACG TACGATTTAC 
TGCAAGAGTG AATGtCGCTA CACTCACACC TGAGGGAGTG GTTCTGTATT CCGGATCTTT 
CGTTAAACGA CCTACTAATA CAACTCTATT TAGCATTTAA ACGCCCCCTC TAATTATTAC 
TTGTCTTCGT CTTCACGAAT AACCATGTAA CX?AA7GATAT CGTCACTGAT TTTAGCTAGA 
CGTTGGAATT CGTCA6TAGC TTTGTTGTTA TCAGATTTAA CACGTACGAT GTTGTAGAAG 
CCATCTTTGA AATCATTGAT TTCATAAGCT AGGCGACGTT TACCCCAGTC TTTTGCTTCT 
AAAACTTCTG CACCTTCAGT AGCTAAGATA CCGTTGAAAC GTTCAACTAA CGCTTTTTTA 
GCATCTTCCT CAATGTTTGG GCGTACGATG TACATAACTT CATATGTTCT CATTTTATAT 
TTGCACCTCC TTGTGGTCTA TACGGCXTAT CAATCTTAAA ACAGATAAGC AAGGaATAAT 
TTTCATTACT CACAATAAAG AATTaTATCA TGCGCCATTA CTTTTTACAA TaATAATTcA 
AACTACTCTT CATATCATTT TTGATATtAA TTCATTTGoA ACTTTCnATG ATATTTTnAA 
AAATACACTT CACAAAAGCG AACATATGTn CTATAAnAGT TGTGAGGTGG TAAGGAATGA 
ATTTA 

(2) INFORMATION FOR SEQ ID NO: 247: 

5i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1032 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



2340 
2400 
2460 
2520 
2580 
2640 
2700 
2760 
2820 
2880 
2940 
3000 
3060 
3X20 
3180 
3240 
3300 
3360 
3365 



45 



SO 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 247: 
GTTAAAAGTA ATTGGTGGTA TTGATGATGA TTTTACAGCC AATGTTATGC ATCCAAATCA 
ATATCGAATT CGATATTCGT CTCAGAAACA GGACCTTAAT GAAGATATGA CAGTTTTTGA 
TGCAGTATTA AGTTCTGATA CAACAACTTT ACGCATCATC AAGCAATATG AGCAGGCAGT 
ACAAGCTTAT GCGGATGACC AAAGTGATAA ATTGTTCAAG CGAATGATGG ATGCGCAAGA 



60 
120 
180 
240 
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ACTAGGTATA CATGATACTA CTAAATACAT TAAAGAATTA TCCGGCGGAC AACAAAAACG 
TGTTGTACTT GCTAAAACAT TAATAGAACA ACCAGATTTA TTGTTATTAG ATGAACCTAC 
GAACCATTTA GACTTCGAAT CAATCAGCTG GTTGATCAAT TATGTGAAGC AATATCCTCA 
TACTGTTTTA TTCGTAACCC ATGATCGATA TTTTTTAAAT GAAGTTTCCA CTAGAATTAT 
TGAACTAAAC AGAGGTAAGT TAGCGTCATA TCCTGGTAAC TATGAATCTT ATATTGAAAT 
GCGCX3CTGAA AGAGAAGTAA CACTTCAAAA GCAACAACAA AAGCAACGAG CTTTATATAA 
GGAAGAACTT GCTTGGATGA GGGCTGGgAG CTAaGGCTCG TACTACAAAG CAACAAGCTA 
GAATTAATCG ATTTAATGAC CTAGAmAATG AAGTTaACCA GCAATATAAA GACGATAAAG 
GTGAATTGAA TCTTGCTTAT TCaAGATTAG GTAAGCAAGT GTTCGAATTA GAAGACTTAT 
CAAAGGCTAT TAATGATAAA GTATTATTTG AACATCTGAC GGAAATTATT CAAAAmGGTG 
AGCGTATTGG TGTTGTTGGG CCAAATG6AG CTGGTAAAAC AACACTCTTA AATATTTTGA 
GTGGAGAAGA CCAACAATTC GAAGGTAAAT TGAAGACTGG GCAGACGGTT AAAGTAGCTT 
ATTTTAAGCA AA 

(2) .INFORMATION FOR SEQ ID NO; 248: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 852 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 24 8: 
TGTGATTAAC GAAGCTTATT TTCGTACACC TTCAACAACT GATTACAACG GCGTTTATCA 

AGGTK^TTAT ATTGATTTTG AAGCAAAGGA AACTAAAAAC AAGACGTCCT TTCCTTTAAA 

ft 

TAATATTCAT GACCATCAAG TCGAACATAT GAAAAATGCA TATCAACAAA AAGGTATTGT 
GTTTTTAATG ATTCGTTTTA AAACGCTAGA TGAAGTTTAT CTTTTACCCT ATTCAAAATT 
CGAAGTATTT TGGAAGAGAT ATAAAGATAA TATTAAAAAG TCTATAACAG TTGATGAAAT 
ACGAAAAAAT GGTTACCATA TTCCTTATCA GTATCAACCA AGATTAGACT ATCTAAAAGC 
AGTTGATAAG TTGATATTAG ATGAAAGTGA GGACCGCGTA TGACGGAAAA CAAAGGATCT 
TCTCAGCCTA AGAAAAACGG TAATAATGGT GGGAAATCCA ACTCAAAAAA GAATAGAAAT 
GTGAAGAGAA CGATTATTAA GATTATTGGC TTCATGATTA TTGCATTTTT CGTTGTTCTT 
TTACTAGGTA TCTTATTGTT TGCTTATTAT GCTTGGAAAG CACCTGCTTT TACCGAAGCT 
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TTAGATAATG 


GCCAAAGACA 


TGAGCATGTA 


AATTTAAAAG 


ACGTGCCGAA ATCAATGAAA 


720 




GACGCAGTAC 


TTGCAACTGA 


AGACAATCGT 


TTCTACGAAC 


ATGGCGCACT 


TGATTATAAA 


780 




CGTTTATTCG 


GTGCAATTGG 


TAAGAACTTG 


ACTGGTGGAT 


TTGGJcTCtGA AGGtGCCTCA 


840 




ACATTAACAC 


AA 










852 


10 


(2) INFORMATION FOR SEQ ID NO: 249; 










(i) SEQUENCE CHARACTERISTICS: 












(A) LENGTH: 


5804 base pairs 












(B) TYPE: nucleic acid 














(C) STRANDEDNESS : double 








IS 




(D) TOPOLOGY: linear 








* 




(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 249: 






20 


CACiTiTnC 


ATTAAAAATC 


TCATATTTAT ACACTGAAC3G 


TAATCTCGAA 


TATTTTTCAA 


60 




CCCAAGTTTT 


AAcrrrAACT 


TTTTCTGGAT AAAAAATAGA 


CTTTTTATAA 


TTGACATTGA 


120 




GGTCAGTCAC 


AGGTGAAATG 


ATTCCTTGTT 


TTTCCATATC 


AGCATAACTA 


AAACCTAACT 


180 


25 


TCGATATATA 


ATCCAACCGC 


GCAACTTCAA 


ACCAAGTTGC 


ATAATTCCCG 


TGATAAATTA 


240 




CACCCATCTT 


ATCAGTTTCA 


GCATAACGCG 


CTTCTATTTC 


TGTAATACTA 


TATATCATTT 


300 




TAAGCCTTCT 


TTCAGTTTAA 


Cl"rrATATCT 


CATTCTAACA 


TAAAATACAA 


GAAGAGGCCG 


360 


30 


GCCAAGAACA 


CAAAGGJcTTT 


GAACCGACCT ATTATATCAT AAaGTTTATA GAAGTATTTT 


420 




TGAGCACTAT 


CAAAGTGCCT 


CAAATACCGA 


TTAAAATTTT 


ACTGTGATAT 


CTATTTTTTA 


480 


35 


TTGCGCTAAT 


TTATTTCTTA 


AAACCATTTG 


TAAAATTCCA 


CCGTGACGAT 


A6TAATCCAT 


540 


TTCAACAAGT 


GAGTCAAAAC 


GAACCATAGC 


GTCAAATTCT ACCAAATCAC 


CATCTTGCTT 


600 




CTTAfSCAGTA 


ACTTTGACGT 


AGtCATGTGG 


TTGAACATTT 


TCATCAATAT 


TAACAGrAAT 


660 


Ad 
■pi/ 


TTCTTCTGTA 


CCATCTAGAC 


CAAGAGAATC 


AGCTGATTCA 


CCTTTTTTAA 


ACTCTAATGG 


720 


TAATACACCC 


ATCATAACTA 


AATTTGAACG 


ATGGATACGT 


TCATAACTTT 


GTGCAATAAC 


780 




TGTTTTAACA 


CCTAATAAGT 


TTGTACCTTT 


TGCTGCCCAG 


TCACGAGATG 


AACCCATACC 


840 


45 


ATAATCGTTA 


CCAGCTAATA 


CAACTAAACC 


TGTACCATCT 


TCriTATATT 


TCATTGCAGC 


900 




ATCAAAGATA 


GGCATTACTT 


CATTTGTTGG 


CCAATAAGTT 


GTAAAACCAC 


CTTCAGTACC 


960 




TGGCGCTAAT 


TGGTTTTTAA 


TACGTATATT AGCAAACGTA 


CCTCGAACCA 


TTACTTOGTG 


1020 


SO 


ATTACCACGT 


CTTGAACCAT 


ATGAATTAAA 


TTCACGAATA GGCACTTGAT 


GATCTTGTAA 


1080 




ATATTTACCA 


GCTGGCGTAT 


CTTTACCAAT 


TGCACCTGCT 


GGAGAGATGT 


GGTCAGTTGT 


1140 
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20 



25 



30 



35 



40 



45 



SO 



TTCTTTAGAT AATCCTTGGA AGAATGATGG ATTTTGAATG TATGTTGAAT TAGGATCAAA 1260 

GTCATATAGA GGTTGATCAG TTACATCAAT CTCATTCCAT AATTCGTTGT TATTGTATAC 1320 

GTTATTATAT TCTTCAATAA ATAATTCAGG TGTTACAACA CTATCAACGG TATCTGAAAC 1380 
TTCTTTAATT GATGGCCAAA TATCTTTCAA ATATACATCT TCACCGTCAT TACCTTTACC - 1440 

AATAGGTTCA TTTTGTAAAT CAATATCAAC CGTTCCAGCT AATGCATAAG CAACAACTAA 1500 

CTGTGGTGAA GCTAGGTAAT TGGCTTTAAC AAGAGGATGG ATACGACCTT CAAAGTTACG 1560 

GTTACCAGAT AATACAGATG TCACTAATAG GTCCTCATCA GCAATCGCTT TTTCAATTTC 1620 

TGGTAATAAA GGACCTGAAT TACCGATACA AGTTGTACAT CCATAACCAA CCAAGTTGAA 16 BO 

GCCTAAATCA TCTAAATAAG GTTGTAAGCC AGCATCTCTT AAATATCCGG TAACAACTTT 1740 

TGATCCTGGT GCTAGAGAAG TTTTAACGTA TTCAGGAACT TTCAAGCCTT TTTCAACTGC 1800 

TTTTTTAGCA ACTAAACCTG CACCTAACAT TACATAAGGG TTAGATGTAT TTGTACATGA 1860 

TGTAATTGCT GCTATTGCAA TATCACCTGT TTTCATTGTA GCTTTTGATC CATCTTTAAA 1920 

GTTAATTTCA GCTTTCTTAT CAAATTCACT TTTATCTAAA CCGTGTCCTT GGTTGCCTGC 1980 

TGGAGCTGTT ACAGAATTTT CAAATGATGA TTTCATATCA CTTAAGAAAA TTAAATCTTG 2040 

AGGACGTTTT GGTCCTGAAA GCGATGCTTC AACTGTTGAT AAATCCAATT CGATAACATC 2100 
TGTATAA7TA GGATCTTCTT TCTCAACATC AAAGAACATA TGGTTTTGTT TCAAATATTC . 2160 

TTTTACTAGC GCGATATGTT CGTCTGATCT ACCAGTTAAC TTCATATATT TAAGAGATTC 2220 

ATCATCAACT GGGAAGAATC CX5CAAGTTGC TCCATACTCT GGTGCCATGT TTGCAATTGT 2280 

AGCACGGTCT GCTAGTGGTA AATGTTGTAC ACCTGGACCA AAGAACTCCA CAAATTTACC 2340 

AACAACACCT TTTTTACGTA GCTCTTGAGT TACTCTTAAC GCTAAATCAG TTGCTGTTGC 2400 

GCCTTGTGGT AATGAATTTA CTAGTCGTAC ACCAATAACC TCTGGAATTG GGAAATAAGA 2460 

AGGTTGTCCA AGCATTCCAG CTTCAGCTTC AATACCACCA ACACCCCATC CTAGTACGCC 2520 

AATACCATTT ATCATTGTTG TATGTGAATC AGTACCAACT AATGTATCTG GAAATGCAGT 2580 

TTTTTCACCA TCTACATCAC GAACATGTAC AACACTTGCT AAATATTCTA AGTTAACTTG 2640 

GTGAACTATT CCAGTTGCAG GAGGAACTGC ATTGTAATTA TCAAATGCTT TCGTTGCCCA 2700 

ATTTAAAAAC TGATAACGTT CATAGTTACG TTCAAATTCT AATTTCATAT TACGTTCAAG 2760 

AGCTTCTGGA TTTGCATAGC TATCCACTTG AACTGAGTGG TCAATAACTA AATCCACCGG "2820 
TACTTCTGGA TTAATTTTAG TAATATCTCC CCCAACGTCA TCCATTGCTT TACGTAAAGA • 2880 

AGCTAAATCA ACTACGGCTG GTACACCTGT GAAATCTTGT AAAATAACAC GAGAAGGTTT 2940 
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70 



IS 



20 



GTCTGTAATT ACAAAATCAT CTTCTTGACG AAGTAAAGAT TCTAACAAAA CACGAATTGA 3060 

ATAAGGTAAA TTGGAAACTT TAGTAATACC TTGCTCTTCT ACAGCTTTTA AATCATAGTA 3120 

AGTATAACTT TGGCCATTCA AGTCAAAATG TTTTTTTGAT TGCTCTTTAA AATTTGCAGC 3180 

CATTTAATGA TCCCCCTTGA TACATTTTTA TATTTATATQ CCTTCATTAA ATTGTATTAT 3240 

TATATTTATT GATAAACAAC TCATCATGCT TAGAAAACGC TTAATTTAGG TTTTGACTTT 3300 

TTAATCAGAG TATATAAGCA AAACTTATCA TACAGGTAAG GTGTAATAAG TATTTTTrAT 3360 

TAATTGAGAA TAATTATCAA TTTCGCGAAT GATTCAATTC AATTTTTAAA CGTATTATTT 3420 

CATTGAGCAG AAAGAAAATT ATGGCACCAA ACTTTAATAT TTTTTTCAAT GTCATTCTTT 3480 

TGATGQGAGT GGGACAGAAA TGATATTTTC GCAAAATTTA TTTCXSTOGTC CCACCCCAAC 3540 

TTGCATTGTC TGTAGAAATT GGGAATCCAA TTTCTCTTTG TTGGGGCXZCA TCCCCAACTT 3600 

GCACATTATT GTAAGCTQAC TTTT06TCAG CTTCTGTGTT GGGGCCCTCA CCCCAACTCG 3660 

CATTGCCTGT AGAATTTCTT TTCGAAATTC TCTGTGTTGG GGCCCCTGAC TAGAATTGAA 3720 

AAAAGCTTGT TACAAGCGCA TTTTCGTTCA GTCAACTACT GCCAATATAA CTTCGTAGAG 3780 

25 CATAGAATAT TGATTTATGT CCCAGCCTGA GTTAAnTTC TATAAAAGTA TATTTAATTT 3840 

GCGTTTATAC CGTCAAACTT CACTTTAGCT TTGTCAAACC CCTTTCTATT AAGTTTTCAG 3900 

AAATAAACCT ATCTTAAAAT ATAAAAAAAT CGAGAATTCG TAGTTTAATA ACGAAATTCT 3960 

00 CGTTCTTATC CTTTTGAATA TACTCAATTT TCCACAAAAA CAAACAAGTA GTATATCTGT 4020 

TCTAGCTACT AGAATGACAT ACrACTTGTT ATTAAAATAC TTAACTAAAC TTTATTAGTT 4080 

ATCTTTTTTC TCTATATTTC TACGTGACTG ACGCTTTTCA AGAATGTCAG ATTCATAATC 4140 

TTCTTGTTGA CTCTTGATAT ATTCTTGTAA GCGATGTTTA TTCGGAGTCA ATGTTAAACC 4200 

TAGGSaTTTA CGTTCCTGGT TCGCATCCTT GTAGAAACTT ACCATCATGA GTATGACGAC 4260 

AAAGGAGAAT GGGAATGCAC TTATAATTGC AGCACTTTGA ATCGCATTTA AAGCTTCAGC 4320 

GCCGTTACCG CCACCAGCTA ATAAAAGTAC AAATGCTATT AAGGCCTGTG AAATTCCCCA 4380 

AACAACTTTT ACCATACTAG ATGGATTTAA TGAACCAAAT GTTGTTTGCA TTCCTAATAC 4440 

AAATGTTGCT GAGTCAGCAG ATGTAATAAA GAATGATGCA ATTAATAATA ATGCAATCAA 4500 

CGATAAAACA ATGCCAAATG GCACATGATT AAACACTCCA AATA6CTGTG TTTCAGGAGT 4560 

CATATCAAAA ATTTCTTTGT GTTTCTTACC TGTCTCGATG CCTAATACAC CAAAGACACT 4620 

AAACCAAACA AAACTAACAA TTGCTGGAAC TAGCAAGACA . CCAGAAATGA ACTCTCTAAT 4680 

XXaAACGTCCT TTTGAAACTC GTGCAATAAA CACTCCAACG AATGGACTCC AACTTAACCA 4740 



35 



40 



45 



SO 
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IS 



20 



25 



30 



35 



TGCTGTATCA AAACTATTAA ACAAGAATGT GTTTAGTAAA CTACCCGTAG AGCTAGTTAA 

CATATTTAAA ATAAGAACAG TTGGTCCAAC AATTAAAGCA GCTACCATTA AAATAGTACC 

TAAACCAATG TTCAAGTTAC TTAAGTATTG AATACCTTTA CTTAATCCAG ACCATGCACT 

TGCTATAAAT AAGATAGTAA CAACAATGAT GATAATCGCT TGTACAAACG TATTGTTTGG 

AACATTGAAC AAGTAATGTA AACCACCATT AATTTGTAGA GCACCCATAC CTAACGAAAC 

GGCTACCCCA ACGATTGTCG CAAATACAGA TAAAACGTCA ATAAAAATCC CAATAGGACC 

TTCTACTrXA TCACCTAAAA GAGGACGTAA AGTTCTAGAT AATAAACCTG GTTCACCnT 

ACGGAATTGC GAATATGCCA ACGTAACGCA ACAACACCAT AAACAGCCCA AGCATGGAAT 

CCCCAATGGA AAAATGTTGA ACGTAGAGCT TCAGTATAAG CTTCAGTAGT TTTGGGATCT 

GCTGTAGGTG GCGTAGCAAA GTGCGCCATC GGTTCAGCTG CACCATAAAA CACCAAACCT 

ATCCCCATAC CAGCACTAAA CAACATAGCA AACCATGAAA TTGTATTAAA CTCAGGTTTG 

TCATTTGGTT TACCTAGTTT AAGTTTTCCA ATAGGACTAA AAATAAGGAA TATACAGAAG 

AACACGATAA TCX5TAGTAA0 AATAAGATAA TACCAACCTA ACTTTTCTGT AATCCACATT 

TTAATATTAT TGGTAACATA GTTGAATTGT TCAGGTAAAA ATGCACCAAG TAATACGACT 

ATAGCAACAA CAATTGCACT ATAGATGAAG ACTGGTGAAT ACTTCTTTCC ATTTGGATTC 

TCTGGTGAAG AAGAATTCAT AATTAATTAC TCCCTTCAAT TCTATATTTA ATTTTATGTA 

GTAGAATAAA AATATTATCT AAACATTTTA TTCAATAACT CACG 

(2) INFORMATION FOR SSQ ID NO: 250: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 400 base pairs 
(3) TYPE: nucleic acid 
(C) STRANDEDNESS : double 
r .(D) TOPOLOGY: linear 



4860 
4920 
4980 
5040 
5100 
5150 
5220 
5280 
5340 
5400 
5460 
5520 
5580 
5640 
5700 
5760 
5804 



40 



45 



50 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 250: 

ACCCGCGAAT ATGGTCCATC CTATCGATTT ATTTTTAACT GGTTTGACAA TATTTAATTT 
... • . ■ . 

TTCATAATCA TTCTTAGTGA TTTTGACATA TGTTTTCGGT ATGAGCCAGT TAATAAATGG 
AAAGAAGAAG ACAATCCAAT TACTTGCCAA ATCaATCATT AAATATTCAC TATCGTATTT 
GATTATTCGA TATTTAGGGT TTTTATTAAT AACTTTAGAT TCGCAAAGCA ATGTCTCCAC 
ATCCCTTTAA TTTTATGTGT AATACATTTT TCGATACTTC AAAAGACATT CAAATACTAT 
CAAGTTACTG TCATCAAAGG TTTTATTAAC TGATATTtTC ATATTTTTAa TCTGAATTTA 



60 
120 
180 
240 
300 
360 



55 



1044 



EP 0 786 519 A2 



(2) INFORMATION FOR .SBQ ID NO:- 251: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 964 base pairs 
(B> TYPE: nucleic acid 

(C) STRANDEONESS : double 

(D) TOPOLOGY: linear 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 251: 
CCAGGGTGCG GAAAGCTTTA AAATTTGGAC TAATAAAGAT GCTGATATTA ATTCTATGAA 
AACAGCAGTT TTACAACAAT TAAAAGGAGA ATAACATATG CTTACTGGcA AACAAAAAAG 
ATACTTAAGA AGTTTAGCAC ACAATATTGA TCCGATTTTT CAAATTGGAA AAGGCGGTAT 
CAACGAAAAT ATGATTAAAC AAATAGATGA TACGTTAGAA AACAGAGAAT TGATTAAAGT 
ACATGTACTA CAAAATAACT TTGATGATAA AAAAGAATTA GCTGAAACAT TAAGCGAAGC 
TACTCATAGT 6AATTAGTGC AAGTGATTGG ATCTATGATA GTGATTTATA GAGAATCTAA 
AGATAATAAA GAAATTGAAT TGCCATAATA ATGAAAAAGA TAryACTTTA CGGCGGTCAG 
TTTAACCCTA TCCATACTGC ACATATGATA GTAGCTAGCG AAGTATTTCA TGAATTACAG 
CCAGATGAAT TTTATTTTTT ACCTAGTTTT ATGTCTCCAT TGAAAAAGCA CCATGATTTT 
ATAGACGTTC. AGCACAGATT AACAATGATA CAGATGATTA TCGACGAGCT TGGTTTTGGA 
GATATTTGTG ACGATGAAAT TAAACGTGGT GGTCAAAGTT ATACCTATGA CACGATCAAG 
GCATTCAAGG AGCAACACAA AGACAGTGAG TTGTACTTTG TTATTGGGAC GGATCAGTAT 
AACCAACTAG AGAAATGGTA TCAAATTGAA TACTTAAAAG AAATGGTTAC TTTTGTAGTT 
GTAAATCGAG ACAAAAATAG TCAAAATGTT GAAAATGCTA TGATTGCAAT TCAGATACCT 
AGGQTAGATA TAAGTTCGAC AATGATTCGA CAAAGAGTTA 6TGAAGGGAA ATCTATCCAA 
GTTCTTGTTC CTAAATCCGT TGAAAACTAT ATTAAGGGGG AAGGATTATA TGAACATTGA 
AAAA 

(2) INFORMATION FOR SBQ ID NO: 252: 
(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1193 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEONESS: double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 252: 
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TTCTCATGAA ATAAATGGGA TGSAATATCAC GACTAGAAGT AATGTTACGA ACAGGAGCGT 120 

ATAAACTAGA GACX3CTAAAT TCGACATAGT ATGTnGCTCA ATTATGGCTG ATGATGAATT 180 

TAAAGTATGT GCGTTGGAAC TGTCGGATTT TTGTTCATAA TGTTTTGCAT ATTGCGCCAT 240 

GATGAATAGT GTAAAAATAA ATAAAACAAT AAGAGATATA ATGCCCATAA TCAAAAGTAT 300 

ITGTTTAGAG CCTTTCATTA TTTCACATCC TTTCTAAAAT ATATTTGTAA CTAAATTTAA 360 

AATAGTTATT TTTGTAATTC TAAACCTTTT TCATCGCGAA AACAATTAAA TAGGTCGCGG 420 

TATTAATTAT TATATTAITA CCGCTTAATA TGAAAAATAC ATGAaAATTA ATTTTCTAAT 480 

ATACnTTGA AAAATTATTA CAAATTAGCC CCTTCAAAAC GCGAAAACAT AAGGATTCTA 540 

GTTTCAAAAG GGCTCATAAG CATAAAATGA AATGTAATAT TTCGATGTAT AAAATTTTTA 600 

ATTAGCTAAA AATCATCGCA TTAATTTTTT GAGCTACATC ATCAAAATTC GGACATTTTA 660 

ACGACACATA TAATTTAATT TTAGGTTCAG TACCAGAAGG ACGTAAAGCG ATAAATCCTT 720 

CGTCAAATAA GACACGAATA ACATTTGATT TAGGAGAATT AATCTGCGAC GTTGTATCTT 780 

TATCCAAATG ATAAACCTCG CTAGTTAAAT AATCTTCAAT TGCTTTCACT TTGAGTCCTT 840 

25 GAATCTCTTC CGGTCGATTT GAACGGAATT TGGTCATTAT TGCATTAATT TTCTTTTTCC 900 

CTTCAAATCC TTCTAGOGTA TGCGgAATAA TGTATCCTCA TGTCTACCAA CAGTTTGATA 960 

AATCTGTTCT AATTCATCIT TCAATGTTTT GCCATATAAT TTTAACTCAG AAGCGTATTT 1020 

TATAATGAGT GGCACAATTT GTACGGCATC TTTATCACGT ACAAAAGGCT CTGATAGAAA 1080 

ACCGTAACTC TCTTCAAATG CGAAAATCAT ATTTGATGAT CATCCAGTTG TCTTATTTCC 1140 

TGAGCAATAA ATTTAAGCCC GTCAGCACCT CTTTGGTATT CAACATTATT ATA 1193 
(2) INFORMATION FOR SEQ ID NO: 253: 



20 



35 



CL) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1098 base pairs 

(B) TYPE: nucleic acid 
40 (C) STRANDEDNESS double 

(D) TOPOLOGY: linear 



45 



SO 



(Xij SEQUENCE DESCRIPTION: SEQ ID NO: 253: 



GAACCTATGT ATTTAAAAAA ACGTACATGT GTACCTACTT TGTTAATTAA TGGGGAACAT 



TATATnCCTT 


TTATTCTCCT 


60 


CCAAAAACCA 


AnGAATATAT 


120 


CATTAA'rrrr 


GCATAAAGAT 


. . 1.80 


TGTTAATTAA 


TGGGGAACAT 


240 
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10 



IS 



20 



25 



30 



AAAAAAATCT TCGAACATTC AGGACATGCA CCGCATATTG AAGAACCAGA AGCATTTATG 
AATTATTATT TAAAATTTTT AAAAAGCGTA TCATAATATG TGATATATAA ACCTAGGGCA 
TAAAGTCCTT AGGCAATGTG AAAAAGCTGA TTACTATTCA TTATTTGATA GAAATCAGCT 
TTTTTTGAAA TGTATTTGAT ATATACTGCT OGTTATGCGG CTATCTTCCT TATATTAAGT 
GCCATTAGTG CAAAACCTCT TAACAATTAG GTAAAAAGAG CATAAAAAAA GGAAGTTTAA 
TAGAATGTAT CATCTATCAA ACTTCACCAA ATTGCGCTAA ACAAAATTAT AGTTCAATTT 
CGTTGTTTGC TTCAGTGATT CGTTTATTTA CTCGACTCAA TAATGATTCG ATTTTTTTAC 
GTTGTTGTGC ATTAACAAGA ATTAATACAG TTCTTTCATC ATGCTCATTA CGTTTTTTAT 
CGAAGTAATC TTCTTGAGAT AAAATTTTAA CTGCTTTAAC AACTTGTGGT TGTTTGTAGT 
TTAAATGATT AATAATATCt TTAAGATAGT ATTCTTTCTC TTTGTTTTCG CTGATGTATG 
TCAATACAGC GAATTCTTCA AAGCTAATTG AnAATTCCTT TTTAATTAAA CTTTTTAATT 
TGTCAGCATA AGTGACCATT GATAACAACT CAAAGCAATC ATTGATTTTT GTAATTGCCA 
TGTTTAAAAC CTCCCTATTT GATGCATCTT GCTCGATACA TTTGCCCCGA TAATATAnTG 
TATCTAATCT TTATGnAT 

(2) INFORMATION FOR SSQ ID NO: 254: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2881 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 254: 
CCAGGTAAAA TTGTGCAATC ATTTGACGCA TTAATGGACG CCTTGGACAA TGAAGATTAT 
GAAGGAGAAA AAGTCATTCC ATTCTTAGAT AAACATTTTA AATATCAAGA TGGCCGATCA 
AGTGAGCGTT TAGTCAGAAA TTTATTTGGT AGCTAAGTTT ATATAGTAGT CAAAGTGGGA 
GAGGTATAAT GATGAAATTT TCAGTAATAG TTCCAACATr CAATTCAGAA AAGTATATAA 
CAGAATTACT TAATAGCCTT GCGAAACAAG ATTTTCCGAA AACTGAATTT GAAGTGGTTG 
TAGTTGATGA CTGTTCAACA GATCAAACGT TACAAATAGT TGAAAAGTAT CGCAATAAAT 
TGAACTTGAA AGTAAGTCAA CTCGAAACAA ATTCTGGTGG TCCAGGTAAA CCTAGAAATG 

kGGCGTTAAA ACAAGCAGAA GGTGAATTTG TATTATTTGT GGACTCOGAT GACTATATAA 

■» . ' ' ■ • ■ * 

ACAAAGAGAC TTTAAAGGAT GCAGCAGCAT TTATTGATGA ACATCACTCA GATGTCTTAT 
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CACCTGAAGT TACTTTGTTA AATTCAAGAA TTATCTATAC TTTAAGCCCG ACTAAAATCT 660 

ATAGAACAGC ATTACTAAAA GATAATGACA TTTATTTTCC AGAAGAATTA AAGAGTGCAG 720 

■ ■ ^ 

AAGATCAATT ATTTACAATG AAAGCATATT TAAATGCAAA TCGAATCAGT GTGTTAAGTG 780 

ATAAAGCGTA TTATTATGCT ACAAAGCGTG AAGGTGAACA TATGAGTAGT GCGTATGTTT 840 

CACCTGAAGA CTTTTATGAA GTCATGAGAT TGATTGCTGT AGAAATATTA AATGCAGATT 900 

TAGAAGAAGC CCATAAAAAT CAAATCTTAG CAGAATTTTT AAATCGTCAT TTTAGTTTTT 960 

CTCGTACGAA TGGCTTCTCA CTTAAAGTTA AACTAGAAGA TCAACCACAA TGGATTAATG 1020 

CTCTAGGAGA CTITATACAA GCAGTTCCAG AACGTGTAGA TGCATTGGTG ATGAGTAAAT 1080 

TACGACCATT GTTGCACXAC GCGAGAGCGA AAGATATAGA CAACTATAGA ACTGTGGAAG 1140 

AAAGTTACCG TCAAGGTCAA TACTACCGTT TTGATATTGT AGATGGTAAA TTAAACATTC 1200 

AATTCAATGA AGGCGAACCA TACTTTAAAG GCATTGATAT OGCTAAGCCA AAAGTGAAAA 1260 

TGACAGCATT TAAATTTGAT AATCATAAAA TTGTTACAGA GCTAACOTTA AATGAATTTA 1320 

TGATTGGCGA AGGACATTAT GATGTCAGAC TTAAATTACA TTCACGAAAC AAGAAGCACA 138 0 

25 CAATGTATGT ACCTTTAAGT GTCAATGCGA ATAAACAATA TCGTTTTAAC ATTATGTTAG 1440 

AAGATATTAA AGCGTATTTA CCTAAAGAAA AAATTTGGGA TGTTTTCTTA GAAGTCCAAA 1500 

TAGGTACGGA AGTATTTGAA GTGCGTGTTG GTAATCAACG TAATAAATAT GCATATACTG 1560 

30 CAGAAACAAG TGCATTAATT CATTTGAATA ATGATTTTTA TAGATTAACA CCGTATTTCA 1620 

CAAAAGACTT TAATAACATT TCGTTATACT TTACAGCTAT TACATTAACG GATTCAATCT 1680 

CATTGAAGTT AAAAGGTAAA AACAAAATCA TTTTAACTGG TCTGGATCGT GGTTATGTAT 174 0 

TTGAAGAAGG TATGGCTAGT GTCGTACTAA AAGACGACAT GGTGATGGGA ATGTTAAGCC 1800 

AAACSTCAGA AAACGAAGTG CnAAATCTTA CTTAGCAAAG ATATTAAAAA GCGAGACTTC 1860 

AAAAATATTG TTAAGTTAAA CACTGCACAT ATCACTTATC CACTAAATAA ATAATAAATG 1920 

CCCTCAAATC ATTGTGAGCC AACATGATTT GAGGGCTTTA TTTTGCTGTT TATGACATGA 1930 

TTATGACATT TCCCTGATTT TCATTTTCAT ATACATTAAA TTGTATACAC TGGAAATGAG. 2040 

GAGGTTATCT ATAATGATAA ATAAAAATGA CATAGTAGCA GATGTAGTAA CTGATTATCC 2100 

GAAAGCAGCG GATATTTTTA GAAGTX3TGGG AATAGATTTT TGTTGTGGCG GACAAGTAAG 2160 

TATAGAAGCA GCAGCCTTAG AAAAGAAAAA TGTAGATTTG AACGAATTAT TACAGCGTCT 2220 

CAACGACGTT GAACAAACGA ATACACCAGG TTCGTTAAAT CCTAAATTTT TAAATGTTTC 2280 

ATCACTTATT CAATATATTC AATCAGCATA TCATGAACCT CTAAGAGAAG AATTTAAAAA 2340 
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TGAGTTAAAA GAAACATACG ATACATTTAA AAATGGCATG TTAGAGCATA TGCAAAAAGA 
AGACGATGTC GATTTTCCAA AACTCATTAA ATATGAGCAA GGTGAGGTAG TAGACGATAT 
TAATACTGTG ATAGATGATT TAGTTTCAGA CCACATTGCA ACGGGAGAAT TGTTAGTAAA 
AATGAGCGAA TTAACATCTA GTTATGAACC TCCGATAGAA GCGTGTGGTA CTTGGCGACT 
TCTTTATCAG AGATTAAAAG CACTTGAAGT GTTAACACAT GAACACX5TAC ATTTAGAGAA 
TCACGTATTA TTTAAAAAAG TATCATAAAT AACGCGATTA GAAACTGTTG GCAAAAATAA 

* - - ♦ • • 

GTCCAGCAGT TTTTCGCTAT GTATAAAAGT CATAATAGTG ACATAAACAG CATTATTTGA 
AAAGAAnAAT GGTCAACTTA GCATAAAAAT TGATATGAAn ATTTAATGGT ATAGATAATT 



C2) INFORMATION FOR SEQ ID NO: 255: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1056 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEONBSS : double 

(D) TOPOLOGY: linear 



Cxi) SEQUENCE DESCRIPTION: SEQ ID NO: 255: 
ACCGTCGAAT ATCGCTTGTG ATTTACAATT TGTGTATTAA GATGCTCAAC TAATTTGGGT 
ACATATTCCG AATTTAGATT TGCAAGTACA ACAATTCCAT AATTTTGTTT TGGATTTAGT 
AAAATAAATG ATGAAAAGTT ATCTAGCGTT CCTGAATGAA ACACTAAATG TTCATCATTA 
TTGGTAAACC AGCCGGAAGC ATATGCATTG GCATTAGGTT CACCAATTGT TGAAGATAAA 
TTTTTATGTG ATTGTTGAAC TAATGATTTG TATTTATCAG GTGGATTAAG TrGGAATTTT 
ATCaATGTT CCAAATCTTC AGTTGATGTC ATCATATATG CTGATGGTGT ATCCCAAAGG 
TTAAATTCAG GTTTAGAGAC GACAGGTGTC GAACCTTGTA ATTCATAGCC AATAGCATCA 
TGTTTTGATT TGTAATTGGT TTGITTGAAT GATGTATGTG TCATATGCAA AGGCTTGAGC 
CATGAATTTG TAATATATTT TGTATAGGAT TGCTTCGTAA CGTTTTGGAT AATTAAACCT 
AATAAATCAT AGTTCATATT TGAGTATTCA AATTCTTCTC CGGGCTTATG ATGTAATTCA 
TCACCCATAA TTGCATGGGT TACATCATTT AAACGATTAT TTTTGCTTGT CACAGAATCT 
tCGCTTGTAA TAtCACTAGG TATACCACTT GTTTGAGCCA AAAGTTGCTT AATCGTAATA 
GTTTCATTTT GACCATTATA GTTCATTTTA AAATGAGGCA CATGTTTGGA TACGGCATCA 
TTTAAGTTTA ATCGACCTTC TTGAGCTAAT TTTAAAATTG CAAGACCTGT GAAAGCTTTC 
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TGATAACCAT 


AACCTTTATT TAAAAAAACT 


TTGccA'rrrr 


CTACTAyTAA 


AATTGATGCT 


960 




CCAGGAATGT 


GTCCCTTTTG TAAATCATGC 


TCGATAACTG 


TATCTATTTG 


TTGTTGCGAA 


1020 


5" 


TCATTGGTTA ACCGTGTCTT CGTATTGCTA TTTAAT 

• 

(2) INFORMATION FOR SEQ ID NO: 256: 






1056 


10 


(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1277 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 








15 


(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 256: 








ATGCCaCACT 


TATTGGTGGC AGGATCGACG GGTAGTGGTA 


AATCTGTTTG 


TATAAATGGT 


60 


20 


ATTATTACAA 


GTATTTTATT AAATGCTAAG 


CCGCATGAAG 


TTAAACTTAT 


GTTAATCGAT 


120 


CCGAAAATGG 


TTGAACTAAA TGTTTATAAC 


GGAACTCCAC 


ACTTATTAAT 


TCCGGTTGTT 


180 




ACAAATCCTC 


ATAAAGCTGC TCAAGCTTTA 


GAAAAAATTG 


TAGCTGAGAT 


GGAAAGACOT 


240 


25 


TATGATTTAT 


TCCAACATTC ATCAACTAGA 


AACATTAAAG 


GTTATAACGA 


ACTAATCCGT 


300 




AAGCAAAATC 


AAGAATTAGA TGAGAAGCAA 


CCAGAATTAC 


CTTATATCGT 


TGTTATT6TA 


360 




GATGAGCTTG 

• 


CAGAlTrAAT GATGGTAGCT 


GGTAAAGAAG 


TTGAAAATGC 


GATTCAACGT 


420 


30 


ATTACACAAA 


TGGCACGTGC AGCAGGTATA 


CACTTAATTG 


TAGCGACACA 


AAGACCTTCT 


430 




GTGGATGTAA 


TTACAGGTAT CACTAAAAAT 


AATATTCCAT 


CTAGAATAGC 


TTTTGCTGTG 


540 




AGTTCTCAAA 


CAGACTCAAG AACTATTATT 


GGTACTGGCG 


GCGCAGAAAA 


GTJcACTTGGT 


600 


35 


AAAGGTGACA 


TGTTATACGT TGGAAATGGT 


GACTCATCAC 


AAACACGTAT 


TCAAGGGGCG 


660 




TTTTTAAGTG ACCAAGAGGT GCAAGATGTT 


GTAAACTATG 


TAGTAGAACA 


ACAACAGGCA 


720 




AATTATGTAA AAGAAATGGA ACCAGATGCA 


CCAGTGGATA 


AATCGGAAAT 


GAAAAGTGAA 


780 


40 


GATGCTTTAT 


ATGaTGAAGC GTATTTGnT 


GTTGCTGaAC 


AACAAAAGGC 


aAGTACATCA 


840 




TTGTTACAAC 


GCCAATTTaG AATTGGtTAT 


AATAGAGCAT 


CTAGGTTGAT 


GGATGATTTA 


900 


« 

45 


GAACGCAATC 


AGGTAATCGG TCCACAAAAA 


GGAAGCAAGC 


CTAGACAAGT 


TCTAATAGAT 


960 


CTTAATAATG 


ACGAGGTGTA AAAAAATGTC 


AGAAATGAAT 


GCGGTATATA 


ACGCTAAACA 


1020 




ATaCATTTCA AATTTg ACTA • AGCAAAATAA 


ATTGGAATAT 


GGTGACCAAC 


TTCCAAGTAA 


1080 


50 


TTTATCAATT 


GCCAGAGAAT TAAATGTAAA 


AACCGACGAT 


GTTTATGAAG 


CAATTCAGCA 


1140 




TTGATTACTG 


AACAAGTCAT TAAAGATAtT 


TTGAAGAGGG 


CACAAGTQTT 


AAGTCACTGC 


1200 
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Gi-tTTGAATG CGGAACT 1277 
(2) INFORMATION FOR SEQ ID NO: 257: 
5 ' (i) SEQUENCS CHARACTERISTICS: 

(A) LENGTH: 3557 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

10 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 257: 

TACCGTCGTT TTATGyGTCA AATTTTACAG TAAATTTTGC TTCATCAAAA GAAATAACCT 60 

IS 

. TTAACAAGTA TAGTAATTTT ACATTTTACA ATGTTACAAA ATATAATTTT TTATAATTAG 120 

TTAAAATCAC TAAAACGCTT TTATACACTA TCAAATCAGC ATTTATAAAA ATATGAACCG 180 

ATATCCTAAA ATGTTAATAA TATTACAAGA TAATAACArA CCACACAAAG CTACTTATTT 240 

20 

TTGATAATAT GGAAATOGTA ATATAAAACn AAAACTTAAT TTACTATATA AATTGTCTTA 300 

ATAATTTTTA AAAGTAGTAA AACATAATTT TAAGGAGGAG TCCCTTTGAA AAAATTAGCA 360 

25 TTTGCAATAA CAGCAACATC TGGTGCAGCT GCATTTTTAA CGCATCATGA TGCACAAGCT 420 

TCTACACAAC ATACAGTACA ATCTGGTGAA TCATTATGGA GTATTGCTCA AAAATACAAC 480 

ACTTCAGTAG AGAGTATTAA ACAAAATAAC CAATTAGATA ACAACTTGGT ATTCCCTGGT 540 

30 CAAGTTATCT CAGTAGGTGG AAGTGATGCA CAAAATACGT CAAACACTTC TCCACAAGCT 600 

GGTTCAGCAT CATCTCATAC TGTACAAGCT GGTGAATCAT * TAAATATCAT TGCTAGCAGA 660 

TATGGTGTTT CAGTTGATCA ATTAATGGCA GCCAATAACT TACGTGGTTA TTTAATTATG 720 

CCTAACCAAA CATTACAAAT TCCTAATGGT GGATCAGGTG GTACAACACC AACAGCTACA 780 

ACA<25TAGCA ATGGCAATGC ATCATCTTTT AATCACCA7UV ATTTATACAC TGCTGGTCAA 840 

TGTACATGGT ACGTATTTGA CCGTCGTGCT CAAGCTGGTA GTCCAATTAG CACATATTGG 900 

40 

TCAGACGCTA AGTATTGGGC TGGTAACGCA GCTAATGATG GTTACCAAGT AAACAACACA 960 

CCATCAGTTG GTTCAATTAT GCAAAGCACA CCTGGTCCAT ATGGTCATGT TGCTTATGTT 1020 

GAACGTGTCA ATGGTGATGG TAGTATCTTG ATTTCTGAAA TGAATTACAC ATATGGTCCA 1080 

45 

TACAATATGA ACTACCGTAC AATTCCAGCT TCAGAAGTTT CTAGCTATGC ATTCATCCAT 1140 

TAATTAAATA-AATTGTACTG ATATATACTA GCAATTCACA TCATGTGAGA TTGCTAGTTT 1200 

TTTATTTTTG AAAAAAATTT TCATTTTGGT ACAAAAAATT ATCTCACCCT TCCCTATCAT 1260 

50 . . . ■ . 

ACATATTTAT ATTTTGTATG AATGGTAGTT AGGTAAAAAT TAACAACCTA CCTATTTGAT 1320 



55 



1051 



EP 0 786 519 A2 



10 



15 



20 



25 



30 



35 



40 



45 



SO 



ATTTAATTTG TTATACCAGT ATTTTACGCT TTTTCGTCTA CATATACAAA TTTATATTAA 1440 

ATAAAGCCCA ATACAATTTA GGTTAATTAA ACAAGTTGAT AACTATTTAA TTATTCCTTC 1500 

ATTCAAGAAT ATAAACTATT AAATCAXTAT TTTGCTCTTA CATATATTTT AATGACCTAA 1560 

CTGaTTATGT TCCATGGAAT ACATTTATAA TATAGCCTCC TAATTAArAT GCyrTGTCTT 1620 

GGTCATTCTA CGTAAATTCT ATAAAATATG TTATCTACTT ACATAArArn CTGrACTTCA 1680 

ATACCACCAT AXGTrXGTGA TACTGAAGTT CAGTTTAGTT TTATTTTCAA TTAGAAAAAT 1740 

AAGTTAAGTA TATAGAATAG TAAACCTGCT AACAATGCTG AAATAGGTAA TGTAATCACC 1800 

CATGTAATGA TCATTCGTTG CGCAgTGCTC CATTTTACAC CTTTAGCTCG GTTAGAAGCA 1860 

CCAACACCTA AGATTGATGA TGACACAACX3 TGAGTTGTTG ATAATGGGAA ATGTAGCGAT 1920 

QATGCAACAA AAATTGTTAA TGCAGATGAT AAATCG6CCG CAGCACCATT TGCTGGACGT 1980 

ATTTTCATAA TATTACCACC TACAGTTTTG ATAATTTTCC AGCCACCAAT TGCAGTACCA 2040 

AGCCCCATTG cTGTCGCACA GGCAAATTTT ACCCATAACT GTGGTTCAAC ACTGCCATCA 2100 

TTCTGTACAT TAGCGACAAT CAATGCCAAC GTAATAATAC CCATTGATTT TTGCGCATCA 2160 

TTCGTACCGT GAGAGAATGA TTGTAACGCT GCTGTGAAAA TTTGGAAAAA TCTAAAGTTA 2220 

CGATTCGCTC TTGTTAAATT TGCATTTTTA AAGATAACTT TAAAAATTGA ATACATCAAG 2280 
AAACCAACAC AAAATGCGAT AATCGGTGAA ACGATTAATA CAATAATAAT TTTTGTGAAA ^ .2340 

CCTTGGTAAT GTAACACTCC AAATGAGCCT TCAGATGCGA TTGCTGCACC CGCAATTGAA 2400 

CCTATAAGTG CATGTGAAGA CGAACTTGGA ATTCCGTAAA ACCAAGTAGC TAAATTCCAA 2460 

ATAATAGCCG CAAGTATTGC AGCTAACACA ACAACTAATC CATTTTCCAA TTTAAATGGA 2520 

TCGACAATGT CTTTAGTAAT GGTGCCTGCA ACGCCCGTAA ATGTTAAAGC ACCTATAAAG 2580 

" - . • - » .... 

TTCATCACTG CTGCCATTAA AATTGCCGTT TTAGGgTTAA CGCTCTAGTA GATACAGCAG 2640 

TAGOTACTGC ATTGGcTGTA TCATGGAaTC CcATTGATAA AGTCAAATAT CAGCGAGAAA 2700 

ATAACTACAG CTATAGTGAC GATGATTATA TATGACATAA ATATATACTC CCCTTAGCTA 2760 

TTTTTCATAA TAATAGTTTC AAAATTATTT GCTACGATTT GACATTTATC AGCGATTTCT 2820 

TCCATGCTTT CATAAATATC TTTTATTTTA ATTAAAGTGA TTGGATCTGT TTCGCTATTG 2880 

AAAATATGTT TAATTGACTG TCTTAAAATA CCATCACAGT TTGTTTCAAA TTCTTTAATA 2940 

TTAATTGAAT GAATACGCAT ATGTGATAAT TTTTTATCGA CTAATAAGCC GACAGCAAGT 3000 

TTCATTTCTG CAACTGCTTT TTGAATGTTA TCAACAAACT CAGCCATATA TTCATCTGTO 3060 

• ■*■'■"' 

TATTCGATTG AATACATTTC AAACATrGCT GCCGTTTCTT CAATTGCATC TAAAACATCA 3120 
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TTTAAATCAG TAATTACTTG ATGTACTAAt tCGcACCATG TGACTCATAA GTTTTAATGT 3240 

TGTCTGAGTA TGCTTTTAAA TCTAAATGTG TATTGAAATC CATTTTACCG AATTCAATAG 3300 

5 CAGCACGATC CAGATTGAAA ACCATCTCTT CTAATTGAAC CA7AAACTTA TCTTTTTTCT 3360 

TACTAAACAT TTAAAATCCT CCATTTAAGC GATTGTCACC AATCACATTC AGTTATAATT 3420 

TGTTTCAAAT TAAGACAAGT GAATTTACAA ACTAATCATA CAAATTTGTT ATTATCAATC 3480 

GTCAGTATAA TTTTAGTGTA CTGATATTAA TTTCAAAAAT GCCTCACAGT AAACAATTTA 3540 

CTGTATTTGC CCTTATA 3557 
(2) INFORMATION FOR SEQ ID NO: 258: 



15 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1631 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(XX) SEQUENCE DESCRIPTION: SEQ ID NO: 2Sd: 

AACTATACAT TTOGAAAAAT TCTTCTAGTG AACCTGCGCC ACCAGGAGCC ATGACAAATG 60 

CATCTGCAAG TTCTGCCATT TTATTTTnAC GTTCATGCAT AGAATCAACT AAAATTAATT 120 

CAGTTAAACG TTGGCTTGTG ATTTCATGTT CATCTAACAT TTTAGGCATG ACGCCAATAG 180 

CTTTGCCGCC ATGATCTAAT ACACCATCTT GaATGGCACC CATAATGCCA ATTGACCCTG 240 

CACCAAATAC TAATTCATAA CCTTGTTCAG CAAAATATTT ACCTAAATCG TATGCTTTTT 300 

GTACATATGA AGGGTCATGA CCTTTGCTTG CACCACAATA AACTGCGATT CGTTTCATGT 360 

35 TAATCCAGCT CCTTAATTCG ATGAATGACT TTTAATAGTG ATTGTTCAAA CACTTTTTGA 420 

TCTTGCTTTG TAAAAGOTGG GGGACCTTTG TGGCGACCAC CTTGTTTTCT AATTTGTGCA , 480 

TTCATATATC GTTTATCTAA TAGTTGTTGA ATATTTTTGG AATTGTATAT CTTCCCATTA 540 

TGATGCATGA CAATTAAGAC TTTGTCGACT AATAAACTTG CGAGTCCATA ATCTTGAGTG 600 

ACTACGATAT CATCCTTCGT TGATAATTGA ACAATTTTGT AATCAACTGC ATCTGGTCCA 660 

TCATCAACAT ATAATGTTGA TACATGTGGA GGATATAATT GGTTCGAAAA ATGGCTGAAG 720 

CTCCGAATAA TTGTCACAAA AATGCCTGTC TCAGTTGTTA AATCTATAAT AGAATCAACA 780 

ACAGGACAAG CATCTCCATC AATAATAATA TGTGTCACAA TTATGCCTCT GTATTGTTTT 840 

CTTTATTTTG TTGAGAGGCG CTTTTGGCAA CATAATCTTT ATATTTTTTA AATGACTTGA 900 

TGCGTGCTTT ATCAGCTTCT TGTTGGCGTT TTTGTTCTTC TTTGTGTCGT TTTTCAATAT 960 
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10 



15 



20 



25 



CGCCTTTTTT CTCAGTTTTC TCATCTAATT TATTAGGTGT TAAGCCTGCT TTTTCTTCGT 
ATTTTTGTGA TTTTTTCATA TCTTTAATAC GTTGTATTTC ATTCTTTTCG CGGGCTTTTT 

« 

GCTCTTCTTT ATGACGCTTT TCGATATTTT TTTGAAGTAT TTTATTCATT TTATCAGCGT 

. * ■ ■ ■ 

CTTTACGATT TTGTTTAGCT AATTTTTCGC CTTTTTTCTC AATATAGGCA GGATCATGTT 
CTCTAGCAAA CTTTTTAAGT TCACGTTTAT TTTCAAAATC TTGTTTTTTA TOGCCGACAT 
ATTCTTTAAC ATCACTCGCT GTGTTACTGA TTGCTGCAGA TGTTTTTGAA GCAACTTTAC 
TTGTAGCATC TGTAACTTTT TGTACGTCCG GATGTTGTTT GATACGTTTA CGTTCAACAA 
TTAACGGTAC CAATACAATT GGTAATACAT TAATCATAAA TTTGATGACT TTTTTCTTAT 
CCATAGATCT TXScCTCCaTA ATTACTTTAT TAAtTTTACa TACCCtATGa TACATCAATA 
TAAACGATGA TAGTAGTGAA TCACTATTAA GTATTTCAGA TGnTtTTAA AAgaAGaCCC 
AATTAnAAAA A 

(2) INFORMATION FOR SEQ ID NO: 259: 
(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 6645 base pairs 

(B) TYPE: nucleic acid. 

(C) STRANDEDNESS : doiible 

(D) TOPOLOGY: linear 



1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1631 



30 



35 



40 



45 



SO 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 259: 
CGAAATCATG ATTTAATGCT TTTTCATATA AGCTTTTCCA ATTAATCTTT CGTCCATGAT 
ATTCTTCAAC TGTTGCTAGA TATTGTGCAA TTTTAGTTAC TTTAAAGGAG TGTGCTGCAA 
CaTTGTGkTC mAAATATTTA AATTTTCCaG GtAATCTTAT AAGTCTTTCC aTATCTGATA 
ATCTCTTAAA ATATTGATGT ACACCCATTT CAATTACCTC CTCCATTAAT TAATCATAAA 
TTATACTTTC TTTTTACATA TCAATCAATT AAATATCATT TaAATATCTT CTTTaTATAA 
CTCTGATTAA ATGATACCAA AAAATCCtCT CAACCTGTTA CTTAAACAGG CTAAGAGGAT 
AGTCTTGTCT TGATATATTA CTTAGTGGAT GTAATTATAT TTTCCTGGAT TTAAAATTGT ^ 

♦ 

TCTTGAAGAT TTAACATTAA ATCCAGCATA GTTCATTTCA GAAACAGTAA TTGTTCCATT 
AGGGTTTACA GATTCAACAA CACCAACATG TCCATATGGA CCAGCAGCTG TTTGGAAAAT 
AGCGCCAACT TCTGGTGTTT TATCTACTTT AAATCCTGCA ACTTTTGCTG CGTAATTCCA 
GTrATTTGCA TTGCCCCATA AACTTCCTAT ACTTCTACCT AATTGTGCAC GACGATCGAA 
AGCATAATAT GTGCAGTTTC CATAAGCATA TAAGTTTCCT CTGTTAGCAA CTGATTTATT 



60 
120 

lao 

240 
300 
360 
420 
480 
540 
600 
660 
720 
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30 



35 



40 



45 



SO 



TACATTAACT GTCTTAGTTA CTGCTTGCTT AGGTGCTTGC TTAACTACTA CTTTTTTAGA 
TGCTTGTTGT ACAGGTTGTT TTACTACCTT TTTAGCTTGG CTTGCTTTTC TTACTGGTGA 
TTTAACCGCT TTAGTTTGTT TCACTTTATT TTGAGGCACA AGTGAAATCA CGTCACCAGG 
AAAAATTAAA GGTGTTACAC CAGGATTGTA TGAATATAAT TGATTCAACG TTAAGTGATG 
CTCTAAAGCA ATCTTATATA ATGAATCGCC AGCAACTACT GTATAAGTTG TCGGTGATTG 
CGTTTGTGCT TGAACATTTG ATACATAATT ATGTTGAACA GGTGTTTTTA CTTGTGTGCC 
ATGTTGTTGT GCATGTGCTG CATTATTTAA AGCTAAAAAA GCTAACACTG ACGAAACCGT 
CACTGTAAGA GATTTTTTCA TCTTGCTGTC ATTCCTTTGC TGTTAGTATT TTAAGTATGC 
AAATACTATA GCACAATACA- TTTTGTCAAA AGCTATTGTT ATAACGATGT AATCAAATGG 
TTAACAATAT AAAAAGAATA CAACCTTTTA TCATAGTGTA AAATGTATTC ATACCATGTA 
ATTGAGAACG TTTTCAATAA TTAATTCAAT ACCTTGAAAA TCGCCATAGG TAATATTACT 
AAATGCACAC TGCATATGTT GTTTTAACAA ACACAACTTT TAAAAAATAT ATTCTAACTC 
TATCTACCGA ATTGTACTTA AATATTCATA AACAAATCAT ATTCCAAAAT CTAATTTACA 
ATTTATTTAG CTACCTTTAA AAAAACCAAA AACCGACGCC CTTTTAGAGC CTCGGTTTTA 
AAATATATAT TAATCGTGCG ACATTGTCTG TCTTAAATAT GATTCGATAA ATGGTCCAAT 
GTCTCCATCC ATCACTGCAT CAACCTTACC TGTTTCTTCG TTCGTACGAT GATCTTTCAC 
CATTGAGTAT GGATGGAAAA CATATGATCT AATTTGGCTT CCCCAGCCGA TTTCTTTTTG 
TTCGCCACGA ATTTCAGCCA TTTCACGTGC CTGCTCTTCC AATTTTAATT GATATAATTT 
AGACTTTAAC ATTTTCATAG CTGCTTCACG 6TTTTTAATT TGAGAACGTT CATTTTGGTT 
ATTAACAACT ATACCTGAGG GGTGGTGGGT AATTCGTATT GCCGATTCAG TTTTGTTAAT 
ATGCTGACCA CCTGCACCAG AAGCTCTGAA TGTATCAACT GTAATATCAT CCGGATTGAT 
TTCAATCTCT ATTTCATCAT TATTAAAATC TGGAATAACG TCGCATGATG CAAATGATGT 
ATGACGACGT CCTGATGAAT CAAATGGAGA AATTCGTACT AGTCGGTGTA CACCTTTTTC 
AGCTTTTAAA TAACCATAAG CATTATGCCC TTTGATGAGC AATGTTACAC TTTTAATCCC 
CGCTTCATCC CCAGGTAGAT AATCAACAGT TTCAACTTTA AAGCCTTTCT TCTCACAATA 
ACGTTGATAC ATTCTAAATA GCATATTAGC CCAATCTTGA GACTCCGTGC CACCTGCACC 
AGGATGTAAC TCTAGAATTG CGTTATTGGC ATCGTGAGGC CCATCTAATA ATAATTGCAA 
TTCGTATTCA TCCACTTTAG CCTTAAAATT AATGACCTCT TGCTCTAAGT CTTCTTTCAT 
TTCTTCATCA AATTCTTCTT GTAATAAATC CCAAGTAGCA TCCATGTCAT CTACTTCTGC 



640 
900 
960 
1020 
lOSO 
1140 
1200 
1260 
1320 
1380 
1440 
ISOO 
1560 
1620 
1680 
1740 
1800 
1860 
1920 
1980 
2040 
2100 
2160 
2220 
2280 
2340 
2400 
2460 
2520 
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TTGCXXrmC CTTTGGTTAT CCCAAAAATT AGGTTCTGCC ATCATTTCTT CATATTCTTG 
AATATTAGTT TCTTTCTTCT CTAAGTCAAA GAGACCCCCT AATTTGTGTT AAATCTTGAT 
TATACTTATC TATATTTCGT TTGATTTCTG ATAATTCCAT AGcATTCGCT CCTATTTATA 
TTTCAATTCA AGTCATTGAT TTGCATCTTT TATAATGCTA AATTTTAACA TAATTTTGTT 
AAATAACAAT GTTAAGAAAT ATAAGCACAC TGACAATTAG TTTATGCATT TATTGTTAAA 
AATCAGTACA TTTATCATCG ACATATGCCT AAACCGATTT TTTAAAACTA AGTACATAAC 
AACGTTTAAC AACTTCTTCA CATTTTTTAA AGTATTTAAC GCTTGTAAAA TAAAAAGACT 
CCTCCCATAA CACAAACTAT AGGTGTTTAA TTGGAAGGAG TTATTTTATA TCATTTATTT 
TCCATGGCAA TTTTTGAATT TTTTACCACT ACCACATGGA CAATCATCGT TACGACCAAC 
TTGATCGCCT TTAACXaTTG GTTrCGGTTT CACTTTTTCT TTACCATCTT CAGCTGAAAC 
GTGCTTCGCT TCACCAAACT CTGTTGTTTT TTCACGTTCA ATATTATCTT CAACTTGTAC 
TACAGATTTT AAAATGAATT ' TACAAGTATC TTCTTCAATA TTTTGCATCA TGATATCAAA 
TAATTCATGA CCTTCATTTT GATAGTCACG TAATGGATTT TGTTGTGCAT AAGAAOGTAA 
GTGAATACCT TGACGTAATT GATCCATTGT GTCGATATGA TCAGTCCAAT GGCTATCAAT 
AGAACGAaGT AAAATCATAC GCTCAAACTC ATTCATTTGT TCTTCTAAGA TATCTTTTTG 
ACTTTGATAT GCTGCTTCAA TCTTAGCCCA AACGACTTCG AAAATATCTT CAGCATCTTT 
ACCTTTGATA TCATCCTCTG TAATGTCACC TTCTTGTAAG AAGATGTCAT TAATGTAGTC 
GATGAATGGT TGATATTCAG GCTCGTCATC TGCTGTATTA ATATAGTAAT TGATACTACG 
TTGTAACGTT GAACGTAGCA TTGCATCTAC AACTTGAGAG CTGTCTTCTT CATCAATAAT 
ACTATTTCTT TCGTTATAGA TAATTTCACG TTGTTTACGT AATACTTCAT CGTATTCTAA 
GATAeCTTTA CGCGCGTCGA AGTTATTACC TTCTACACGT TTTTGTGCTG ATTCTACAGC 
TCTTGATACC ATTTTTGATT CAATTGGTGT AGAGTCATCT AAACCTAGTC GGCTCATCAT 
TTTCTGTAAA CGTTCAGAAC CAAAACGAAT CATTAATTCA TCTTGTAATG ATAAATAGAA 
GCGACTATCC CCTTTATCAC CTTGACGTCC AGAACGACCA CGTAACTGGT CATCAATACG 
ACGAGATTCA TGTCGCTCTG TACCTATTAC TGCTAAACCG CCTAATTCCT CTACGCCTTC 
ACCTAATTTG ATATCTGTAC CACGACCAGC CATGTTAGTG GCAATAGTAA CGGCACCTTT 
TTGTCCAGCG CCTGCAACAA TTTCAGCTTC ACGTTCATGA TTTTTCGCAT TTAACACATC 
ATGACGGATA CCACGTTTTT TAAGTAAATT TGAAATATAT TCAGAAGTCT CAACTGCAAC 
AGTACCTAAT AGCACTGGTT GCCCTGCCTT GTGTTTTTCA ACAACATCTT CTACTACTGC 
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TTTATTTGTC GGAATTTGAG TTACTGTCAT GTTATAAATA TTTCTAAATT CTTCTTCTTC 4440 

AGTrrXAGCT GTACCTGTCA TACCCGCAAG TTTATTGTAC ATTCTGAAAT AGTTTTGGAA 4500 

^ TGTAATAGAC GCCATAGTTT TAGATTCATT TTGAATTTGA ACGCCTTCCT, TCGCTTCAAT .4560 

AGCTTGGTGT AAACCTTCCG AGAAACGACG GCCTGGCATT GTACGTCCTG TAAATTGATC 4620 

GACAATTAAT ACTTCGCCAT CAACAACCAT ATAGTCTACG TCACGTTGTA ATGTAACGTG 4680 

CGCACGTAAA GCTGTGTTGA TATGACTAAT AACATCAACA TTTTGrACAT CATATAAGTT 4740 

TTCAACTTTG AACATACGTT CAGCTTTATC CGCACCTTGT TCTGTTAAAT GTACAGCTTT 4 BOO 

CGTTTTTTCA TCGTATTTAT AATCTTCGTC CTGTTTTAAC ATTTTCGCAA AAACATTTGC 4860 

75 

TTGTGTATAA AGTGACGTTG ACTTTTCAGC TTCACCAGAA ATAATTAATG GCGTACGTGC 4920 

CTCGTC6ATT AAAATTGAGT CAACCTCATC AATGATTGCA AAATGTAATG GACGCATTAC 4980 

TCTATCTTCA* GAATAATTCA CCATGTTATC TCGTAAGTAA TCAAAACCTA GCTCATTATT 5040 

20 

AGTACTGTAA GTAATGTCTT GTGCGTATGC TTCACGTTTT TCTTCTGTCG TCTTACTGTT 5100 

TAAGTTTAAT CCGACAGTCA AACCTAAGAA GTTATATAAC TCAGCCATTT CTTCACTTTG 5X60 

25 AACACTTGAT AAGTATTCAT TGACTQTAAT AACGTGAACA CCTCTACCAG CTAATGCATT 5220 

TAAGTATGTT GGCATTGTCG CTGTTAATGT TTTACCTTCA CCTGTTCTCA TCTCAGCGAT 5280 

ATCACCTTTA TGAATTGCAA TACCACCCAT AATTTGAACT TTATATGGTG TCATATTGAA 5340 

30 TACACGTTTA GAGCCTTCTC TAACAAGTGC ATATGCTTCT GGTAAAATTT TATCTAAATA 5400 

ATCATTTTGC TTTTTGACAT TATCAATGTC AGCTAATTCT GTTTGGAATT GTTTCGTTTT 5460 

ATTACGAATT TCTTCATCAG TTAAAATTGC CGTTTTTTCT TCTAAAGCGA TTACTTTATC 5520 

AGCAAGTTTA CCTAACTGTT TAATTTCTTT ATTATTGCCA TCAAGAATTT TTGATAAAAA 5580 

TCCCATTTCG TTCGCTCCTT TAGCTAAAAA ACTGTTTGGC CTACAACAAT ATATCTTATC 5640 

ATTfATAGTT AGAAAATTAT ACTTATTTAC TCATTTGTAlS AATCAATATA AATATATTTA 5700 

40 

TGACATACTT CATTCACATT CTGTTGTCAA CAAGTTTATC ACTAATAAAT ATATTCTCAA 5760 

TACGCAATTA TACTTCCTAA TAAATTATAT TATAAATATT TTACGATTTT CGACTCGGAC 5820 

TATACAATAG ACTGACATAC TATTATTAAC TTAACATTCA AATATATACA TCCATTAACA 5880 

45 

TTAGCATAGT CACTATGTTT CATTCAACAA ATTACATTAT CGAACTATGA AATAGTCATA 5940 

ATTTGCTTTT GGAGTATAAA AAAGCACTTG TGCAAAAACA CAAGTGCTTT AAACTTAATT 6000 

TATTGTTCAC TAGTTTGAAT CAAGCCATAT TTACCGTCTT TACGGCGGTA AACGATACTT 6060 

50 , . . . - 

GTTCCATCAG TTTCTCTGTC TGTGAATACA AAGAAGTCAT GACCTAATAG ATTCATTTGT 6120 

55 
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ATCTCGTTAT CATCGTAAGC GTCATTATCA ACTTGTGTTT CTTGCATTTC TTGTAATTCG 

GCAACAAACA CTTCTTGATC TCCTCGATCA CGGCTCTTAC GATTAATACG TGTTTTATAT 

TTTCGAACTT GTCTTTCAAG TTTATTATTA ATTAAATcAA TACCTGCGTA TAAATCATCG 

TTTCGCTCTT CAGCTCTTAA CGTAACATTT TTCAATGGAA TTGTTACTTC AATTTTAGTA 

GCTGAATTTG AATAAGXTTT AACTTTAACA TGCGCCACTG CATTTGGTAC GTCATTAAAA 

TAACGTTCCft. ACTTACCAAT TTTTTCCIcCA ATATAGTTGC GAATAGCATC TGTGATAGTG 

AGGTTATCTC CATGAATTTC AAATCTAATC ATAGTAAATC TCTCCTTAAA CCTCTTTATn 

GGnAAcrcaT TATTATATTT AACATTTTTA CGCCAATCGT GCAAA 

(2) INFORMATION FOR SEQ ID NO: 260: 

(i) SEQUENCE CHARACTERISTICS: 

(A> LENGTH: 7430 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

- 

{xi) SEQUENCE DESCRIPTION: SEQ ID NO: 260: 
CAGTTCCAGC ACAtCTATTG GGGATCAACA AACTAGGGAA AATGCTAATT ATCAACGTGA 
AAACGGTGTT GACGAACAGC AACATACTGA AAATTTAACT AAGAACTTGC ATAATGATAA 
AACAATATCA GAAGAAAATC ATCGTAAAAC AGATGATTTG AATAAAGATC AACTAAAGGA 
TGATAAAAAA TCATCGCTTA ATAATAAAAA TATTCAACGT GATACAACAA AAAATAACAA 
TGCTAATCCT AGCGATGTAA ATCAAGGGTT AGAACAGGCT ATTAATGATG GTAAACAAAG 
TAAAGTGGCG TCACAGCAAC AGTCAAAAGA GGCAGATAAT AGTCAAGATT CAAACGCTAA 
TAAC&ATCTA CCTTCACAAA GTCGAATAAA GGAAGCACCA TCATTAAATA AGTTAGATCA 
AACAAGTCAA CGAGAAATTG TTAATGAGAC AGAAATAGAG AAAGTACAAC CACAACAAAA 
TAATCAAGCG AATGATAAAA TTACTAACTA CAATTTTAAC AATGAACAAG AAGTGAAaCC 
TCAAAAAGAC GAAAAAACAC TATCAGTTTC AGATTTAAAA AACAATCAAA AATCACCAGT 
AGAACCAACA AAGGACAATG ACAAGAAAAA TGGAITAAAT TTATTAAAAA GTAGTGCAGT 
AGCAACGTTA CCAAACAAAG GGACAAAGGA ACTTACTGCA AAAGCGAAAG ATGATCAAAC 
GAATAAAGTT GCCAAACAAG GGCAGTATAA AAATCAGGAT CCTATCGTTT TAGTGCATGG 
TTTCAATGGG TTTACAGATG ATATTAATCC TTCAGTGTTA GCTCATTATT GGGGCGGTAA 
TAAAATGAAC ATTCGCCAAG ATTTAGAAGA AAATGGTTAC AAAGCTTATG AAGCAAGTAT 
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TCGTGTAGAT TATGGTGCAG 


CACATGCAGC 


AAAATATGGA 


CATGAACGTT 


ATGGAAAAAC 


1020 




ATACGAaGGA ATTTACAAAG 


ACTGGAAACC 


AGGACAGAAG 


GXACACCTAG 


TTGGACATAG 


1080 


5 


TATGGGCGGT CAAACGATAC GTCAACTAGA AGAATTACTG CGTAATGGTA ATCGTGAAGA 


1X40 




AATAGAGTAT CAAAAGAAAC ATGGTGGcGA AATTTCTCCA 


CTATTCAAAG 


GTAATCATGA 


1200 




CAATATGATT TCATCAATTA 


CTACTTTAGG AACACCACAT AATGGTACAC 


AC6CATCAGA 


1260 


10 


TTTAGCTGGT AATGAAGCTT 


TAGTGAGACA AATCGTATTT 


GATATCGGTA AAATGTTTGG 


1320 




TAATAAAAAT TCAAGAG7AG 


ACTTCGGGTT 


GGCTCAATGG 


GGTCTAAAAC 


AGAAGCCAAA 


13B0 


75 


TGAATCATAT ATTGATTATG 


TCAAACGCGT 


TAAACAATCT 


AATTTATGGA AATCAAAAGA 


1440 


TAATGGATTT TACGATCTGA 


CGCGTGAGGG 


TGCAnCAGAT 


TTAAATCGTA AAACGTCGTT 


. 1500 




GAACCCTAAC ATTGTGTATA AAACATACAC 


TGGTGAAGCA ACGCACAAAG 


CATTAAATAG 


1560 


20 


CGATAGACAA AAAGCAGACT 


TAAATATGTT 


TTTCCCATTT 


GTGATTACTG 


GTAACTTAAT 


1620 


CGGTAAAGCT ACTGAAAAAG 


AATGGCGAGA 


AAACGATGGT 


TTAGTATCCG 


TTATTTCTTC 


1680 




TCAACATCCA TTTAATCAAG 


CTTATACAAA AGCGACAGAT 


AAAATTCAAA 


AAGGCATTTG 


1740 


2S 


GCAAGTGACG CCTACAAAAC 


ATGATTGGGA 


TCATGTTGAC 


TTTGTAGGAC 


AAGACAGTTC 


1300 




TGATACAGTG CGCACAAGAG 


AAGAATTAGA 


AGATTTTTGG 


CATCATTTAG 


CAGAOGATTT 


1860 




AGTGAAAACT GAAAAGCTGA 


CTGATACTAA 


GCAAGCATAA 


TTTATAAAGT 


AAAGGGAGGA 


1920 


00 


ATTAATAATG ACTGCAGACT 


TCTTTCAATT 


AATCGGATCA 


TTATTTAGAA 


TTCTAAAAGA 


1980 




ATTATTCAAG TAAAACATTG 


GCGAGGCCCC 


AACATAAAGA 


ATTTCGAAAA 


GAAATTCTAC 


2040 




AAACAATGCA AGTTGGCGGG 


GCCCCAACAA 


AGAAGCTGGC 


GGAAAGTCAG 


CTTACAATAA 


2100 


3S 


TGTGCAAGTT GGCGGGGCCC 


CAACATAGAA 


GCTGGCGGAA AGTCAGGTTA 


CAATAATGTG 


2160 




CAAQTTGGGG TGGGACGACG 


AAATAAATTT 


TGCGAAAATA 


TCATTTCTGT 


CCCACTCCCA 


2220 




TTGGCATTTA CGAAGTTTAA 


ATGTGCAATT 


AGAATATATG 


TATAACAATA 


TTAAACACGC 


2280 


40 


GGTAAAACGA AGTCAGTCAA 


TTCAAACTGA 


TTTCGCCCAC 


CGCGTGTTTT 


TAACATAGC7 


2340 




TAATAATTAA TAAGCATTAA 


TGTTCAATTT 


ATATGGTTGT 


TTTCCAATAA 


TAAACCTAAA 


2400 


45 


GATATAGAAT TCACGCAATA 


TCATGCCGAC 


ACCTATACAT 


AATCCTAAAA 


TGAATAGTAG 


2460 


TGATATCGCT AGAAAGACCA 


TTGTATTATC 


CTCAAATATA 


TTTGTATATG 


CAAACAATGA 


2520 




GTCTAGAATG ATTGGATGTA 


ATAAATAAAT 


AAAGAATGAG 


AAAGCACTAA 


TCATTTGAAT 


2S80 


SO 


CGTATTAAAT AACATTGTTT 


TAAAATGCGT 


GCAAATACCC 


AAGATAACAA 


TAAACATAAT 


2640 


ACTATTATAT GGTGTTAATG 


AATATGAAAA 


GCTGGTAACG 


TTCCAATAGT 


CTCCaTTTGT 


2700 
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10 



IS 



TCTAAGAAAT TTAATACACG TTCGTAGTTA TAACCCATAT ATGCACCTAA GAAGAAATAA 
AAAATCCATC CGAATATTAT AGTATTTTCA CTTAATGGAT AATAGTCTAG CACGGTATCG 
TGAAACGCTC TGTTGTTCGT AAAGTAATAT AAAAATGATT GCTGTAAAAT AAAAGATAAC 
AATAATAATA TTTTACTGTT GAATAGGTTA TAGTTAATTT TAAAAATGAT ATAACTCAAA 
ATAAAGAATT GCATGATAAC AACGATAAAA TAGCCATACC ATTGACCTAA TAGGACATTT 
TCAATGAATT GTTTATTGAA ACTTGAATCT GTTAATAATG ATTCACTATA ACTGTAAAAC 
AATCCCATTA ATATGTAAGG AATAAGXATA TATTTTACGC GTGTAGTTAA GTATCTATAG 
GTGACTTTTT GGTAATTCAA GGTTGTCAGT AACTGTGACA AGATAATAAA GCAAGGTGTA 
CCAAAAATCA CAATATTACG AATGTAAAAT TGTAACACTA AGGATCCACC CTCCATATTT 
TCATGTTTTA AAGTAATTTG TGTAAGTAAA TGTGTGATAA TAATAATTGC ACATATAATA 
GCACGTAAAT ATACGAGTTC AAGTCTAATC TTTTTCATGG AATCCGTCCC ATCTCTTAAT 
TAAATGCTCA AAAGCATCAT CACTAATTAA TATTCTAGGG ATGTAATAAT CATTGGAGTT 
CGGAGTGACT GCTTTTTCCT CTAATGAAAA ACCGTATTTT AACCCAGCTT TTTTGATTAC 
CGGTAATTTA TCGTCATTCA TCAAGCCATA AGGATAGGCT ATAGTTTTCT GCGACTTTTT 
AAAGTTTTTA GTTAGATATT TTTCACTTTT GTTTAAATCT TTTATGATTG TAGCTTCAGA 
AGCTTTCATT AATTTTGACT TATTATTTTT AGATAAGTTA TGCAAATCGT 6GGTATGTGT 
TTCAAATTCC CATAACCCAG TTTTATACAT TTCrTTTAGT TCTTTTTTAC TAATCATATC 
GAGGTTGTGA AAGTTTTCTT CCCCAACATG ACCTGTGATA ATAAACCCAG TTGCCGGTAT 
TTTATATTTT TTTAAGATTG GATAAGCATT TTCATAAATA GTTTCATCCA TATCATCAAA 
35 GTTAATCCAT ACACTTCGTT TTGGaAACTT ACCTTTTTTC TXGtAATATA AAAATTCTTT 
CAAC3GTTAAA AATTTAGCAT CATGTGATTT TAGCCATTTT ATTTGAGATT CAAATTGTGA 
TTGACTAACA CTATAATTTT TAATTTCTTT ACTACTAGAA AAGAAGTAAA TAAAATTATT 



20 



25 



30 



40 



45 



SO 



CAGAAAATTC GCTTTTCTTA CACGGTGATA ATTTAATGCC AGAGCACTAT TTTCTTTATA 
TTTCAGTTTT TTAGGTGAAT CGTCATCTGC ATTTGCAATA TGATGACCAT CCAGTGTGCT 
TACAGGCAAT ATGATCAAGA TACTCAACAC TAAAATTATA AATTTTCTAT ACTTCACGAT 
TCTCTTCCTC TCTGCCATTT TTGAATCAAT ATGCTAATTG TAAAAAATAC AAAAATGATA 
ATCGCGAAAA TGCCCATAGT TTCAAATATA TCTAAAATTT CAGTATTTTC AATGTTTAAA 
GCAACACGTA TTGTATTGAT ACTTTCGTCA TGAATTTCAA ATATAGTACC AATATAAACG 
AGTAGAACAA CTAAACAATA TATCCAAAAG ACACAAGATA TAGCGATAAG TGCTGTTTCT 



2820 

2880 

2940 

3000 

3060 

3120 

3180 

3240 

3300 

3360 

3420 

3480 

3540 

3600 

3660 

3720 

3780 

3840 

3900 

3960 

4020 

4080 

4X40 

4200 

4260 

4320 

4380 

4440 

4500 
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TTGCX3TAACC ACCTTTCTTA COTTTTAATG CTTTTGGAAA TGCGACAAGA ACTACTGCTG 4620 

CGTTAATAAT CCAGTATACT GTCGGATACC AACTTACAAA TATGAGTCCA GCCATATTCT 4680 

■• • 

5 TTTTCTCGTA GCGACTATCA ATAAAGAGTG CGACTGTAAA TTGAATAACG TTTATAAAAG 4740 

TCATAGTAAA TGATGATAGT AGAAATATTG AAAAACTATA TGTCATAAAT GTATAGTCTA 4800 

AGAAGTTTGC TGTTATGAAC AAATAGCCTA AATATAGAAG CACTATATAT ACCCATAAAA 4860 

10 

TCGAGATGAT TTGCTCAAAC ATCAAAATAT ATAAAGGAAA CCTTTTCGTT TTCATTGTGC 4920 

TAAAAAAOTC TCGTAGTAAT ACTTCGTGTC CCCCTTGAGC CCATCTCACG CGTTGCTTCC 4980 

AAAGACCTCC CAATGTTTCT GGAACCAACA TCCAACACAT GGCAAGCGGT TCATACTTAA 5040 

TACGATATCC ACGTAAATGC AATTTCCAAG AAACTCCAAT ATCTTCGGTA ATCATATCAG 5100 

TATCCCAGTA GCCAACGTCG ACAACTCCAC TTTTTTTAAA TAGAGTGAAG ACACCCOAAA 5160 

TAGTATTGAC TGCGCCAGCA AGTGTCTGAC TtCGCTTAAT ACAGCCAATT AAACTTGCAT 5220 

20 

ATTCTATCGT TTGAATTTTA CCTAAAATAG AACTCTTATT TCQAATTCTA GGATTACCTG 5280 

TAACTGCACC AAGTTTTGGA TCATGTTTGA AATTCTCAAT CATATAATAT GGTGCATCTT 5340 

25 GATCAACGAT AGTATCTGCA TCCAAGCACA TTACATAATC ATATGAAGCC TGTTTAATGC 5400 

CTTGATTGAG TGCGTTGGCT TTACCTCTGT TTTCTTGTAA ATCGACGAAA ATAAAGTCAT 5460 

TATTTTCTTT GATTTTATAG ATGAGTTCTG CTGTATTATC TGAACTTCCA TCATTAATGA 5520 

30 TAATAATTTC TTTCTTCTCG TATTTGAGTG CAAGAACATT AGACAACGTA TCTTCAAyCG 5580 

TTTCACTTTC GTTATAACAG GCAAGTAAAA ATGTAATGCC TTCTAATTCA TCCACATTTA 5640 

TGTCAGGCTT CTTGTTCAAT GAATATCTAA TTTCTCTGGT AAAATAGAAA TAAATTGAAC 5700 

CGACAATCCA GTAAATAGAC ATAAATACAG GATAAAAAAG CAAAAAGTTA AAAAATTGCA 5760 

ATrtCTTTAC CTACCTTTCG TTAGTTAGGT TGTAAGCCAT ATGGTAATTG ATAGTATTTT 5820 

AATTTGCAAT AGATTGTTGT TATAATTAAA CGGAAATATT TGTAATTGCA ACTTAATTTT 5880 

40 

CCTGTAACAT AGTGTGATTA ATTTTCAGTA GGGGGTTATA AAAATTGAAG GATAAGATTA 5940 

TTGATAACGC AATAACCTTA TTTTCAGAGA AGGGGTATGA CGGTACAACA CTTGATGATA 6000 

TAGCTAAAAG TGTAAATATA AAGAAAGCGA GTTTATATTA CCATTTTGAC TCGAAAAAAA 6060 

4S 

GTATTTACGA ACAAAGTGTT AAATGTTGTT TTGATTACCT TAATAATATT ATTATGATGA 6120 

ATCAAAATAA ATCGAACTAT TCAATTGATG CTTTATATCA ATTCTTATTT GAGTTTATTT 6180 

TCGACATCGA AGAAAGGTAT ATTAGAATGT ACGTTCAATT ATCTAATACG CCTGAGGAAT 6240 

SO 

TnCTGGAAA TATTTACGGA CAAATACAAG ATTTAAATCA ATCATTAAGT AAAGAGATAG 6300 
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TGCTGTTTCT TGAAAGTTGG TATTTGAAAG CATCCTTTTC GCAAAAATTT GGAGCAGTGG 6420 

AAGAAAGTAA AAGTCAATTC AAAGATGAAG TGTATTCGCT ACTAAATATA TTTTTGAAGA 6480 

AATAATTTTT GTTACTAGTT TGTAATAATT AACTTACTTT TGTAAAAAAA GACATGAGAT 6540 

TATTTTTTTA AATCTATATA AAGTTGACAA TACAAATCGA TATTGAGAAT ATTAAGATGT 6600 

ATATGAATTT TATAAATTAA ATGCAATACA TTAATATAAA TATCAATTGT TGCAAAATAC 6660 

GATTTGTTCA ATGATTTGAT AATATTATTC TTTATATTTG TGAATGGTTA AGTTTGTCTT . 6720 

TGAACATATT ATAAAAGTGT AATGTTCCCC TGAAAAGAAT AAGTTGTCAT CTAATTACAG 6780 

GAAATCCGCA TAAATTAGAT GAAATGGAAA GTAATAAGTA ATAATTTATT GATAAGCXSCC 6840 

TATGTGATGG TAAATCATGA CATAGGCGCT TTTTTTTATA AGTTAAAAAT GTAAATAAAA 6900 

ATTATATAAA TTACCCACAT CTTTTTAAAA GGTGTGGGCT TTATTATCAT TAACCCAACT 6960 

20 CACAGTGACG GGTTACGCAA GGTATTGAAT TACCGAGTAC GGGCACGCTC GGTGTTGTAA 7020 

AGAGCAAATA ATCAAGTAAT GATGATGCTT CTACTCGATT ATAAGAAAGC CATGATAGAG 7080- 

TACGATGGTA TCTAGTTTTA TTATTAATAG GTTTGGATAT TTAAAGTTGG ACAATATTAT . 7140 

ATCTTGTGCA AAAATATAAA TAAGTTATAC ATAATGGTAG AGAATCATGA TATAATTTTA 7200 

AACGATAAAA TATTTATATA AATAATTAGA GaAAATGTAG TTGTGTATGT yTTGTGGtCG 7260 

TTAAACTAGA TATAATTGTC CGATTTATAA AACATACATA ATGAATACaA TGATTGATTA 7320 

TGTGGAGGAA ACCATGAmAG AmAAGTTTgA TTTAGTAAAA CTATTAAATA TTCTAAAGAA 7380 

GAATATTAAA TTATTGCTTA TTTTACCGGC AATATGTCTT GTAGTAAGTG 7430 
35 (2) INFORMATION FOR SEQ ID NO; 261: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4082 base pairs 
r (B) TYPE: nucleic acid 

(C) STRANDEDNHSS : double 
' (D) TOPOLOGY: linear 



25 



30 



45 



SO 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 261: 

ATTGTTACTC ATTATTTTTT CATATTCACA CAAATGATCT TGTTTATATT TAGCTAATTG 60 

ATTTTTATCT AGCATTTTAT CCTCCTGCTG AGTTTGTAAC CTTTAATAAT TTATTTTCTA 120 

TAAAAACTTA GTATTCCAGT TGCTTATTAT ATCATTGATG AAAGGCTGAA ATAAAACATA 180 

AACTGTTCCG ACCATTAACG CTGTAGCTAA AGATAAGTCT ACAAGTCCAC CTGTTTTAAA 240 

TTGAATCGGT GTCTTCACAT TAAACGGTAA gGA3cnAAAAT AATTTCACGC CTTTTGGTGT 300 
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75 



20 



25 



30 



35 



40 



45 



50 



AGGCGTCTGA ATAATTTGCA ATAAAAATGC TATGATTGCG ATAAATAATA TTGAATGCGT 
AAAGGTTCGA TGTCCAAAGA TCAATCTCAC AAAAAAACTA ATTACCTTAA ACCTTCTGCC 
AATCTTACTT TCAGTGTGAC ATATATCGGG TAATAAGCTA GCTAGAGTTG CTAGAATGAT 
AACCGTAACC GACX5AAAAAA TATCCGTTTG AAAATATTGT GTTGTTAGCG CTCCAACGAG 
CATGCCGCAT GAAGCATGTG TTTTACCTGT CATATTTGTT CTCCTTTAAT ACTCACATTT 
TACCACATCC CTAACAAAAA CACGAACATA TTTTCX3GGTT AAAATTCATT AGTATGACAC 
AATTTAAAAA AGTATCACAT AACTCTTGAA AACGATTACA AAATCGTrXA TGATGTATTT 
ACAAAATATT TAAAGGATGT GTTTGAATAA TGGCAATGAC AGTAAAAAAG GATAATAATG 
AAGTGCGTAT TCAATGGAGA GTTGCTGATA TCAAAATTCC TACAAGTGAA ATTAAAAATA 
TTACACAAGA CCAAGATATT CATGCAGTTC CTAAATTAGA CAGCAAAGAT GTATCTAGAA 
TCGGCTCAAC GTTTGGTAAA ACGAATCGCG TTATTATCGA TACTGAAGAC CACGAATACA 
TTATTTATAC TCAAAATGAT CAAAAGGTTT ACAATGAATT AACTAAATAA ATTGTATAAA 
AaAATCATTC ATGGTGAGGG CTTCATGAAT GATTTTTTTA ATTGATTCAA CACCCAGCAT 
AAACAAATAC AAAAGGACAA CTGTTCCCAT AATTTTAACA GTTGTCCTTT TTCACATATA 
TTTATAACAA AAGATGTGCC ATCAAAGAAA TAATTGGTAG TGTAATGATT GTTCTAATCA 
AGAAAATCAT AAACAATTTG CCGATGCTTA CAGGAATCTT CGAACCAAGT ATGACGCCAC 
CTACTTCAGA CAAGTATATT AACTGCGATA TACTAAGTGC CCCAATAACA AAACGAGTTA 
TATCATTTTG TACACCTTCA ATTAATATAG AAGGTAAAAA CATATCGGCA AAACCOATAA 
TAATCGTTTG AGAAGCCTGT GCCGCTTCAG GTATTTGCAT TAACTCTAAA AATGGAACAA 
AAGGTTTACC CAATATGACA AAAAAGQGCX5 TGTAGTTCGC AATAATGGTA GCAATAGTAC 
CAATACTCAT TACTACAGGC AAAATAACAA ACCACATATC AATGACTGTT TTTAATCCTG 
ACTTAAAAAA GTCAATAACG CCCGGTGCTT TAATACCTAC TTCTGTTGCA GTATCAAAGC 
CATGTCTCAA TGCCGTCTTT CCTTCTGGCA ATGCCTCAGT ACGCGCACTT TCAGGTACCT 
CCTTAGCATA CTCATCAGGA ATTTTATTTA AAGGCCAAAT TCTTGGCATA ATGACTGCTG 
CAACGAGGCA GGATACTATC ACTGATAAAT AGAAAGCAAA AAATTGATTT TGCATGTGCA 
CTGTTTCAGC AACTACAATT GCAAAGGTGA TAGAAACTAC ACTAAATGTC GTTGAAATAA. 
CTGTTGCCTC ACGACGAGAA TAATATCCTT CACCATATTG TCXACTTGTA ATTAAGACAC 
CAACAGTTCC GTCTCCAATA AATGATGCTA AATTATCTAC CGTCGAACGT CCTGGCAATG 
TAAATAAAGG TCTCATAACC GGTCTAAAAA TAGGACCCAA CATCTCTAAC AAACCGTATT 



420 
480 
540 
600 
660 
720 
780 
840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 
1920 
1980 
2040 
2100 
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AACTTGAGAA. CAATAATCCA 


CCCGTTTCAT 


CTGAGTAAAT AACCTTTGAA 


CCAATTOGTA 


2220 




AAAATGTCAT CCATGCAAAA 


ACAACTGCTA ATATTCGTAA AATTAACCAA 


CCAATTCTAA 


2280 


5 


CGTTAAAAGC ATTGTTCATT 


AGCCCGTCAG 


GTTTCAATTT ATCTTTTAAA 


ATAGTTGAAC 


2340 




AAATCAGAGT TATGATACCC 


GATAAAGTAA 


TTATCGTCAC AATTAAAAAT 


GGCATTACGC 


2400 


10 


CACCTAATAC ATCTTl'AAGC 


ACGCCTGCTA 


AAAATGCCAC GGGCAACGTT 


GTTTGCTTCT 


2460 


GTCCATCTTG TTCGACTGGA 


ATTGGTACTA AAAATAATAA GATACCAATT 


AAAGACATCG 


2520 




TAATAAACTT AAGTCTCCCA 


ATAACTATCT 


CTTTCCTTGA AAAGCTATCC 


ATAAAATCAA 


2580 


15 


TCCATTTCTC TATGTATTCG 


TTTTAAGTAT ATACAGAATT CTATTCAGTT 


AACAAACATA 


2640 




TTCCTTATCA TTCTATCrrr 


CAAAATGTTT 


ATGTATGCAA AATAATGAAT 


AATTACAGTT 


2700 




ATTAAATATA CGCTATTTCT 


TGTAATTTTT 


CAAGATGAAT TCAAAAAAGG 


TTAAGTACAA 


2760 


20 


TTACTGATTT CGTACTTAAC 


CTTTTTTAAA 


CTCTAATCAT ATGTTAGTTA 


TTTCATTCTT 


2820 




-CGTAATAATA TTAAGAAGTA 


TGGTGCACCG 


ATAATTGCAA TGATAACCCC 


AACAGGAATA 


2880 




TCCAGTGGCG GATGAATGCC 


ACGGGCTAAA 


CCATCTCCAA ATGTTAACAA 


TATAGCACCA 


2940 


25 


ATTAACCCCG ACATGATAAT 

< 


AACGTGTAAT 


GTTTTATTTC CTATTAATTG 


TCTCGCAATA 


3000 




TGAGGTGCAA TTAATCCTAA 


AAAGCTAATA 


CCACCGACAA CTGAAATTGC 


GGATCCTGCT 


3060 


tin 

30 


' AATATTACTG CTAAAATTAA 


CAATAGCATT 


TTAATAGTTT TAACTTTTAA 


ACCGAGTGCG 


3120 


GTTGCAACAG CATCACCTAG 


ATTCAATACA 


TCTAATTGAT AACTCAATAA 


AATGATGATT . 


3180 




GGTATCGTTA TTAAAAACCA 


AGGTAATATA GTATAAATAT TCGACATATC 


ATGTCCATAT 


3240 


35 


AGACTACCTG TCAACCAAAC 


AAGCGCTTTG 


TTTGCTTCCA GTGGATTTCT 


GATTAATAAG 


3300 




AACTGCACAA TCGCCGTACA 


TATTGCGCCT 


ATTGCTAAAC CAATTAAGGC 


AAGCTTTGAA 


3360 




CCna'AAJCAT CATATTTTGA 


AATTAAAAAT 


GATAAAAATA AACTTACTGC 


AAAGGCACCT 


3420 


40 


AAGAAXGAAC CTATAGGTAA 


TACAAACAAT GGTGCTGTTG GAAAGGTCAT 


AATAATAATC 


3480 




ACAGCAGCTA AACTGGCACC 


TTTAGAAATA 


CCTATAACAT CAGGTGAGGC 


T/^CGGGTTT 


3540' 




CTTATTACAG CTTGTATAAT 


TGCACCTGAA ATAGCCAAGC TACTACCGAT 


AATAATACCA 


3600 


45 


AGTAATGTTC TAGGTATACG 


ATACTCATTT AAAATAAAAT CATCTTGTGT 


AAAGATTCCC 


3660 




TTAATAGCAT CAATCGGATG 


AATCATGACA 


GACCCTACAC ATAAACTTAT 


GAATATACTC 


3720 


SO 


ACAATTAAAA GGATTGTGAT 


TAAACTATAA CGACGTATAA TTTTCGTTGT 


CATCATATTC 


3780 


TTTTCACCCC TTTAATCGTT 


ATAAATAAGA AGTAAAGTGC ACCTACGAAT 


GATGTAACAA 


3840 




TCCCTACTGG TGATTCATAA 


GGATATGTAA TTAAACGACT TAATACATCT 


GATAGTAGTA 


3900 
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AGCGTTTGAC TATATGCGGT ACGATTAAGC CAACAAATCC AATTGGTCCT GCCACTGACA 
CCGACATACC TGTAAGAATA ATGACTAATA GTCCAATGAT AATTCTAACT TTATTTATAT 
TT 

(2) INFORMATION FOR SEQ ID NO: 262: 
(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1145 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 262: 



TATTAGAAG6 


TCGTTCGGAT 


GAACAATTAA 


AAAATTTAGT 


TAGCGAAGTA ACTGACGCCG 


TAGAAAAAAC 


AACGGGGGCA 


AATAGACAAG 


CAATTCACGT 


TGTTATAGAA 


GAAATGAAAC 


CAAACCATTA 


TGGTGTGGCT 


GGCGTAAGAA AGTCAGATCA ATAATTCTTC ATAAGATGCA 


TGCCAATTAA 


TTCTTTGAAA 


ACGAACAAGG 


OGACTTCTAT 


CTGaGTATGA TAGAAATCGC 


CTTGTTTATT 


TTTAATCTTC 


ATCTAAAAAO 


TCTTTAATAG 


CTTGTTTATT 


TGTGTTTTTA 


TTAATCTGTA 


ATGCACTACC 


ATCAGTATTT GTATTGACAT CyTCGTATGA GTTCTTGATT 


GGCaCAGTCA 


ATGACTTAAC 


ATCTTTTTCA 


CCTCGGATAC 


CaAAACTCAA ACCTGTTTGG 


AAAATCCCTG 


AATCAGGAAT 


GTTTGTATTC 


ACATAGCCTC 


TTAAAATACC 


TGCAACTTTT 


GGTAATTTAA 


CAACTGTTCT 


AAAATTAACC 


ATTTCTTTTT 


TCAATGTTTG 


CATCACTTGT 


TGCTGACGTC 


GCACGCGTCC 


GAAGTCACCT 


TCAGGGTCGT 


GACGGAATCT 


TGCATAACCA 


AGTAATTCTT 


TACCATTCAA 


CCTATGGTTA 


CCCTTTTTCA 


AAGATACACC 


AATATTTTTC 


GACKTATCTT 


TTTCGACATT 


AATTGGTACA 


CCTTCAGGCA 


TTAATTCATC 


AATCATTTTC 


TCAAATCCAG 


TAAAATCAAC 


TACTGCATAA 


TATTCAGGAT 


TAATTCCTAA 


ATTTTTATCA 


AGTGTTTTTC 


TAAGTAGCTC 


TGGACCACCT 


AAAGCGTATG 


CTGAATTAAT 


TTTGTGTTTT 


CCATATCCTG 


GAATATCTGC 


ATAAATATCA 


CGCATGACAG 


ACATCAITXT 


CATCTTTTTA 


TTGATAAAGT 


CATATTGAAC 


AACCATGATA 


GAATCTGTTC. TTGATTGTCC ACCTTGTGCT 


TTATCTGCAC 


CGAGTACAAG 


AATAGAAATT 


nTACCATCAT 


TTTTTACTGG 


TCCATTAAAT 


TGATGTACTT 


TAACATCTTT 


CGCATGTTTC 


TTGGCATATT 


CTACACCGCT 


ATTGTAACTA 


TGTACAATAT 


ATACAACTAA 


TGCCGATAAG 


TAAAATTACA 


ACAATCAGAA 


GAATGATAGG 
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30 



35 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 7075 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : doxible 
■(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 263: 

TATGGCTCAT CATTAATGCA CGTATCGGGT AGCGTTTACC ATTGATAAGT GCTTCATGTT 60 

TAGCACGAGT TCTTAAAATT CCATCGCCAT AACCGATATC AACTACAGCT AATTTTGTAT 120 

TGTTTTrAGT CACTTCAAAG GCAAAGCTAT AACCGCAATA ATCACCAGCT TGTACTTCGC 180 

GCACTTGAAT AACATGTGCT TTTAAAGTTA ATGACTGAAC TATATCATGT TGATTCAGTG 240 

AACTATATGG TCTTGAACCG TATAACGCAA TACCTACACG CGCATGTGTA TGGTGGGGTA 300 

20 GTAATAyyyg TCCTTCCCGA TAAAAACTCG CACTATTTTG AGCATGGATT AGGTCGAACT 360 

GATAACCTTC AGATAAAAGT GCTTCAACAA TTTCCATCCA TTGTGAACGT TCAACATTAT 420 

AAtCTGACAC ATCGAATTCA TCAGCATATC CAAAATGGGk CCATAAACCA CTAATAATCA 480 

25 TTTTTGCATT TTGATTATGA TGGTGATCTT TCAATACTTC TTTAATTTCG TTTAAATCTT 540 

TAAATCCAGA CCGATGTAAT AAATTTTCAA ATTCTAAGTG AACATGAATA CCAGCTAAAT 600 

CATTTTTATG GTTATAGTAA TATGTCAACG ACGGCAAAGT CATGTGTATT TGATGTTCAC 660 

GGACTAAATC AAACTCGTAA ACTGCATTCA TTAAAAAGAT TGTTGCATCT GGAGCAAGTT 720 

GTCTAATTTG AATTGCTTCT CGTAGTGATG TTGTGCTAAA TGTATCTATA CCTGCATGGA 780 

TAAACTGAGT TACAGCAAAT TCTAGGTCAT AGTGATATGC ATTaTTTTTA ACAACTGCCA 840 

TTAATGGCTG ATTGTTTTTG ACTGTGATTG CATTTTGTAA AAATATTTTC TTATTTACAG 900 

ACCfltTGTTGC TGTCAATGTA TTACACCTCT TTGTAATTAT TTAATAAATT TTCGTAAAAA 960 

40 TTAACCACGT TTATTAACAC TTTTTCATCA AAATTTAAAT GTGATGTGTG CAAACCAGTT 1020 

ACAAAACCTT TATCTTCATT TCGTGTTCCT ATAAAAACAA AGTAAGCTGG AGCTAGTTGT 1080 
TGACCATAAA AACTAAAATC TTCCCCAAAT AAGAATGGCG TTGGTTTGTC ATAGACATTT ' 1140 

''^ AAATCAGCTT TTATTAAGGC GTCCTCTATT TGAGTACGTA ATTTCGGACT ATTGATTGTA 1200 

GGGGGATAAC CTTCTGCAAA TTTAACTTCA CAATCTACAT TAAACAGAAG CTTGACACTT 1260 

TCTGCTATCT TGTGCATTTG ATTTTTAACG ATTGTTAAAT CATCAATATC ATATGTACGA 1320 

SO 

ATAGTACCTT CTAAATAGCC ATTACTTGGT ACAGTGTTAA TCGCTTCACC AGCTTTAAAA 1330 

TGACCAATAT GAACAATATT TCGTTTCAAA CCGTTAAGGT GAAATTGTTG AATTTGTGAT 1440 
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ACATGACTTG ACAGGCCTGT TAAGAAAAAG CGATACTCTG TTGCGCTGGC CGTAATTTCT 
TCATCTCTTA TCACTGCAAT GCCTTCATCA GCAAATGGGT TAACATGAAT ACCAAATACC 
GCTTCAATTG GATACTTATC AAAGGCACCG GCTTTTATTA ATCGATTTGC ACCGCCACCA 
GTTTCTTCTG CAGGTTGGAA AATGAAAACG ACATTTTGCG GTAATTGACC TGCATCTTGC 
ATGTCTTTGC AACGTTGTAC AAAAAGCATT AATGCAGTTG TATGACCATC ATGTCCACAA 
GCATGCATCA CATGATCAGA TTGACTGCGA TAAGGCACAT CATTTTCCTC TAAAATAGGT 
AACGCATCAA TATCAGCTCT ATACGCTATC GTATGTGAGC CATTACCTTC TAAGTATGCA 
15 ATGACGCCAG TTTCCAATGG GCAATCGTAT TTAATATTTA AACTATCTAA AAACGCTTTA 
ATATAAGCAG TTGTTTCAAA TTCATGTAAG CTTAATTCAG GATGTTGATG TAAATGACGG 
CGATGTTTCG TAACAAATTC TAATTCATTC ATAATTATCA ATCCTTTGTG TTAAATTACT 
ATATAAATAG TGTAACGtAT TTCGAAATTT GTGATCATAA GTTTATTCAA TCCTAAACAA 
TAAGGTTGAG ACATAATCGT ATCTCAACCT TGAAATTATT ATACGTTGAC GTCACTAGTC 
ATTCAGTTTT CTTAATGCTG CTACAATCTC TTTTTTAGTA TCTTGTACTT CAGAAGCTTG 
CTTAATCACT TTTGCAGGTG TACCAGCAAC AACTGCACCA GCTGGTACAT CTTGTGTCAC 
AATCGCGCCA GCTGcAACAA TAGCACCTTT ACCAACACGT ACACCTTCTA AAATAACTGC 
ATTTGCACCG ATTAATACAT CATCCTCGAT TATAACCGGT GAAGCACTAG GGGGTTCAAT 
CACACCTGCT AATACTGCGC CAGCCCcTAC ATGTACATTT TTACCAGTTG TAGCACGACC 
ACCGAGAGTA GCATTCATAT CAATCATTGT ACCTTCGCCA ACGACTGCGC CAATATTAAT 
35 TGTTGCGCCC ATCATAACGA CAGCACCATC TTCAATAATG GCTTGTTCTC TAATAAACGC 
ACCTGGTTCA ATTCX5TGCAT TCGTATTTGT TAAGTCTTTT AATGGAATAG CAGAATTGCG 
ACGATCCATT XCAATTTCTA TATCTTCGAA TTGACTACCA TATGCTTCGT AAAAAGGTTT 
CCAATCATCC GCTTCACAAA AGATTACTTT AGATTGTTCT GAACCAAATA CTTTAAAACT 



25 



30 



45 



SO 



ATCGATCTCC TTTAATATGT TTATAAGTTG TCAAACGTAT AAAAGCCGTT TGGTTTATTA 
ACTAAGCGTT CTGCTGCTTG TATTGCACCA TTCGCAAAAA TATCTTTTGA TTGTGCACGA 
TGCGTGATTT GAATCGTTTC ATCAGTGCCA GCAAATAGAA CTTCATGTTC ACCGACAATC 
GTACCTCCAC GAATAGAATG TATACCAATA TCTTGTGGCT GGCGTTTTTC ATTTAATTCA 
TGTCTATCAT ACACAGGTGT TACATTTTCT. TTCAAAGATA OGATCACATC ATACAATTTT 



CGTAATTTCT 


1560 


ACCAAATACC 


1620 


ACCGCCACCA 


.1690 


TGCATCTTGC 


1740 


ATGTCCACAA 


1800 


TAAAATAGGT 


1860 


TAAGTATGCA 


1920 


AAACGCTTTA 


1980 


TAAATGACGG 


2040 


TTAAATTACT 


2100 


TCCTAAACAA 


2160 


GTCACTAGTC 


2220 


CAGAAGCTTG 


2280 


CTTGTGTCAC 


2340 


AAATAACTGC 


2400 


GGGGTTCAAT 


2460 


TAGCACGACC 


2520 


CAATATTAAT 


2580 


TAATAAACGC 


2640 


CAGAATTGCG 


2700 


AAAAAGGTTT 


2760 


CTTTAAAACT 


2820 


GTGTAGACTT 


2880 


CCATAAAATA 


2940 


TGGTTTATTA 


3000 


TTGTGCACGA 


3060 


ACCGACAATC 


3120 


ATTTAATTCA 


3180 


ATACAA'rriT 


3240 
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TCGAAATCAT CAAGTAGGGG AACAGCAGCT GCTAAAATTT TAGTCAATGC ATGAACGCCA 
TAACTCATGT TCGCGCTGAA AAACACAGGC ATATTTTGAC TCAATTCATC TAACTTATTA 
AGTAGTTTTT CTTTCTCGnC CAGTgTTGCC .ACAACTAATG GCAAATGAAA ATCTTCATCT 
AATAAAGGGA AAAGCAGATT TGGATTTGAA AAATCTATTG CAACATCGGC ACCTTTAACA 
TCTGCAATAT GTTGATATTG TTGATATGGC GTTGTTGCTT TCGGTGTATT TTCAATGACC 
CCAACGATTT CATGTCCTTT TTCTTCTGCT AATCTAGCAA CGCGTTGATT CATTGCGCCA 
TAGCCAATTA GTAATATTTT CACTCATTTT CACCCGCTTT AAATGTGTCA TATGTTTCAC 
GAAGCACTTT AGTATCTGTA TCTTCTAGGC TAACCAATGG TAGACGTAAT TCATAATTTC 
CAAATCCTAA ATAACTTGTT AGAGCTTTAA TAGGAATTGG GTTAATATCA ACTGATAAAG 
CTGATAACAG TGTGCCGATT GGTTTAAATT GATCTTGAAT ATCTAATCCA CTTTGTTGAG 
CATCGTATAA CGCTTGAAAT TCTTTAGGAA TGACATTGGC AATAACAGAG ATAACCCCTT 
GACCGCCACG TTGATAGTAT TCGACGACGT TGTCATCATT GCCACTATAT AATGCAAATG 
AAXTTGTATC AATGCGCTTT. TTCACTTCTT CTAAATACTC AAAATCATTC GTAGCATCTT 
TTAftAGCAAC TATATAAGGA TGTTGACTTA ATATTTCTAC AGTTTCTGGT TCAATTGTCA 
TGTTCGTTCT TGAAGGAACA TTGTACAGCA CGACTGGTAA TTTCACAGCA TCTGCAATCG 
CTTCAAAGTG TTTGACTAAA CCACGTTGGT TCGTTTTGTT GTAGTAGGGC GTAATTAACA 
TAATTGCATC AGCCCCTAAG GCTTTAGCTT GGATTGAAGC TTGGATTGAC TTTTCAGTAT 
CATTAGTGCC AGTTCCTGCT ATGACAGGAA CACGTTTATC TACAAGATCA ATAACTGTTT 
TTAGAATGCG TTCTTTTTCA TCTGTTGTTA AAGTAGGGCT CTCAGCAGTA GTTCCATTAA 
CGATGATTGC TTGGGCATTA TTTTCTAGTA AAAAATTAAC GTGTGTTTTC AAAGCTTCAA 
TAT^ACTTT GTTATTTGTA AAAGGGGTTG TAAGTGCaAC SCCAACACCC TCAAATAAAT 
GTGTCATTTT AATTCGCTCC TTTTAAACX5C ATAACTTGTT CCAATACTTG TACAGCATTT 
AATGCAGCAC CTTTTAATAA ATTGTCTGAT GTACACCATA CATGGAAAGT ATTTTCTAAT 
GAATCATCTC TACGTATACG GCCAACAAAC ACTTCATCTT TATTAGTAGA ATTGATTGCC 
ATTGGATATT CATTGTTCTC TGGATTGTCT ACTAAAACAA CGCGGTCATC TTGATCAAAT 
AACGCTTTAA TATCTTCTGC TGTTGTTTCT TTGTCAAGCG TTACATCAAT TTCAACACTA 
TGACTATCTT GAACAGGCAC ACGTGCGCAT GTTGCTGTTA CTTTTAAGTC TGGCGCATTT 
AAAATTTTTC TCGTCTCATC AATCATTTTT TGTTCTTCTT .TTGTATATCC GTTTTCTAAA 
AACACATCAA TATGCGGTAA CACATTATTA TAAATTGGAT GTOGATATGC TTCTGGTGCT 
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TGATATGTTG TATATGCCAC TCGTTTTAAA 
ACAACAGATT GAATCGTAGA GCAGTTTGGA 
TCATTGACTT CCGGAACGAT TAAATCAATA 
TCTATAACGA TTGCACCAGC TTTTTCAAAA 
CCAGCACTCA TTAATACATA ATCGAAATGT 
ACTGTATATG TTTTTCCTTG AAATTCAACT 
AATACTAATT CATCGAAAGG AATATTTTTA 
ACTAATCCTG TTGCACCCAC AACTGCTAAC 
TAATTTCCaA TTTTTAGAAT ATTTTAACAA 
TATAGTTTTT CTACCGCTTG TTGCCCATTA 
TCAGATGTTG TTGTTTGGTA GAAAGGTATA 
GATGCCACAC CTGACATATC ACGCATGCCT 
TCATTGATTT TATAAGCTAA TGCTTCATAT 
ATTTGATGAA AATCACTATC TTTAATCGTG 
ATTTGTGAAA TCATATCAAC ATTTACAGCA 
AGTAGCTGAT TGTCAGGTAG GGGATAACTA 
GCCACACCAG TAACTGCTTT TTTCTCTAAT 
TTCACGTTCG ATAAAGTTTT TCCTAAATAT 
ACACTTCTTG TTTCAAGTAC ACCAGCACCT 
GAGACGATGT CTAGTCGTTT AGCCTTTGGT 
TCAACGTCGG TATAAATTTC ACAAGGTATT 
GTATCAGAAC CACCTCTGCC TAAAGTTGTT 
CCAGCAACTA CTAAAATATC GTTTTCTTGA 
TGAGCAATTT TACTTTTTAA ATGATGGCCA 
ATTGCTTTGG CATTCATACC GATATCATTT 
TGCTCTCCGG TTGrCAATAA.-TAATGCCAGT 
GATACATTCG TCATTAATTG ATCTGTTGTG 
TTGTTCATCT TGATTGACTC GCTCCTTTAA 
ATCACTQACG GATGATCCGC CAAATTTCAA 



CCATAAGCAT CTTGCAATAC TTTTAGAGGT 
TTGGCAATGA TACCTCTTGT AAATGTAGGT 
TCTTCTGCCA TACGCCATTG ACTTGAATTG 
AGTGGGGCAA AGTGTTCGCT TGTACCGCCA 
TCACTTGCAC GAGCATCAGT TAATTCTTGA 
TCTTGCCCTG CAGAACGTGC TGATGAAAAT 
CGATTTAATG TCTCCAACAT TTTTGTACCT 
TTTGTCATAA CTTGTCACTC CATTTTATAA 
TCATTTTACC ATTAAATGTT AAATGCGTCA 
AAATCATCAA TGACGTATGA AATACTTATT 
TTATTTTCAA TTAATGTCAA AAATGCTTTT 
GAGCCAATTA ATGAAATTTT GACATAATGC 
TGATTCTTTA ATGTTTCAAG AATCATAGAA 
AAGGATAGTT GTAGCCCATC CAAGTTGACG 
CCTTCTTCAA GTTCCGTAAA TAGTTGGGTA 
ATTGTTACAT GCATCATATG TTTATCCAAA 
ATTTCTTCAT TTGACATAAT CCATGTTCCT 
AAAGGGATAT TATAGTTTTT AGCTAATTCA 
AAAGCGCTCA TTTCCATCAT TTCTTCATAT 
AAAAGTCTTG GGTCAGTGGC ATACACACCA 
TGATTACTAA CAGCAAGTGC CACAGCGGTC 
AATTCCTGAT GTTCATTGAT GCCTTGAAAT 
AAGGCTTGTT CAAATGTTTG AGGATTAATT 
ATGGTTTTAA TACCCGCTTG ATAGCCAGTC 
AATACCATTG ATAAATAAGA TACAGTTTGT 
TCTTGTTGTT TTGGTGCTTT AGTCAAGGTT 
TTACCCATAG CACTTACAAC GACAATTAAa 
CATTTCAGCG ATCCTTTTTA TTTTTGTAAA 
CACACTTCTT GTTACCATAT AATCCTCCTA 
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TAATCTATAT ACAAGTGATG CACTCCATTA TTTTTAAATA ATGACAAACT CTCAGCTCTT 6960 

AACCAAAAAG TCCAACAAAT TATAACTGCT ATTATAATTG CTTCGGCATC GCACCCTTTC 7020 

5 

AAATTTAGCT GTTAGCAGAC AGTAATCTAa ACTTTACTCA TGATTGATGC GCCTC 7075 

(2) INFORMATION FOR SEQ ID NO: 264: 
(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 5171 base pairs 

IB) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

<D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 264: 

AGACGTACTT TGTGATTmCG AAGyrCGTAC TGmAGCACTT GTCGACGTTG ATGTACTTGT 60 

TGAACCTGAT TGACTAGTAC TTTGTGATAA TGACTTACTA TCAGAATCAG ATGTACTTTG 120 

TGAATCACTT AATGATTCTG ATGTACTACC TGACTGAGAC GTGCTCATTG AACTACTTAC 180 

GGACATTGAT TTACTGTCTG ATGCAGATAA TGACCCACTT GTACTGATAG AGTCACTTAC 240 

2S 

TATCTCTGAA GTACTCATCG AGTCTGATGT ACTTGTTGAG ACACTTTGTG ATGCTGCTAT 300 

GCTTAGTGAT CCAGAAACAG AACCACTTGT GCTCGTCGAA TCGCTCAATG ATTCTGATGT 360 

ACTCATCGAT TTTGAATCAC TTGTACTTAA TGATATTGAT GTACTTTGTG AATCTGATTT 420 

30 

GCTTGTTGAC GCACTTTGAG AGTTGGCTAT GCTATTTGAA ATACTGATAG AGTCCGAGGT • 480 

GCTAGCTGAC TCGCTCAATG ATGTTGATGT ACTAATTGCA TTCGATGTAC TGTCACTTAA 540 

35 TGATGCTGAT GTACTAGACG ACCCTGATAT ACTCGTTGAT AAGCTTTGTG ACTTAOACAA 600 

GCTTCCTGAT GTACTCATAC TTAATGAGTC ACTGAGTGAT GTTGATGTAC GCAATGAATC 660 

AGATSTACTT GTTGATAGAC TTTCGGATTT TTCAGTACTG CTAGAGTTTG AAATAGAATC 720 
* 

GCTTAATGAT GTTGATTTAC TAGCTGAATC CGACATGCTT GATGATACAC TTTGTGAATT 780 

CACTAAACTT GTGCTTGTTG AGCTTGATAC ACTATTACTT TCAGATGTGC TTAATGACTT 840 

AGATGCACTC ACAGAATCAG ATAGGCTTAC ACTTGTCGAT TTCGAGGTAC TAGCTGATGT 900 

4S 

AGATACCACA ATCGATCCTG ATGTACTCGT TGATGCACTT TGTGAGTCAG CTTTACTTGT 960 

TGACACACTT TGAGATTGTT GTGTACTTCC TGATGTTGAT ACGGAATCAC TCATGCTATT 1020 

TCTTGTTACT TCATATTTAA AAGTTGTCGT CGTTTTGTTA CCGCTCGCAT CTGTAGAAAC 1080 

GATTGATATA GTACTTGTAC CAATGTTTGT TGGTGTACCA CTAATAGTAT TATTTGTACT 1140 

MCAAATGTT AGTCCGGATG GCAATCCAGT CACTGTATTC GTCACCGCAT TTCCACTGTT 1200 
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ATTGGTGTCA CTGTTGGTGC TGTCGTATCC ACAACATTTA TTGTAAAAGT TGTCGTCX3AT 1320 

TTGTTATTTG CTTGGTCAGT AGACACAACT GTCACTGTTG ATTGACCAAT TTTTGTTGGT 1380 

GTCCCAATGA TTGAATTCGT TGCACTATCG TAACTTAATC CGCTTGGTAA TCCTGTAACT 1440 

GTATTTGTCA CAGTCCCAGT ACCATTATCC GTTGTAGTCA ATACAATAGG ATTCATTGTT 1500 

TTACCCACTT CTATGGTTTG ATTGCCTACA GTTACAGTTG GTGCTTrTAC ATCAGTAAAA 1560 

TAATATGTCA CTGATTGTCC AGCATTCGTC ATnTTACAG TTTTATTTGT ATCATTATAA 1620 

GTTGACGCAT ATGAACTATC GACGGACGTG TAGTTATATC CTTTAGCAGT CAATGCAGAT 1680 

1$ TGCTGaTTAT CGATTGTCAC GACTTGATCA ACATTTCCTG AATATGTTTT TGGTGGAATA 1740 

ATATCTTTAC CTGTTGTTAC ATCAACGTAT CTCACTTGTG TAnCAGCAGA CTCTGTATAT 1800 

TCGAATGTTC CAAATTGTAC TTGTTGTAAA TTTGTCGCGC CACCTGTTGA GGCTGTCATT 1860 

GATAATGAAA AGTTGGTCGT ACCACTTTTC GCAATCCAAT CTGAAATATT ACGTGTCCAT 1920 

GTTTGACCTG CATATTTGAC AGTCATAACC TTTGTATCAC CATTATA6TT AATATCAAAA 1980 

TCrrCGaACG TGTTATTTGT AGGTTGaACA TTTAACTTCG CAGCATTATC AGCTGTTGAA 2040 

CTTGATGTAT ACGTTGTCGC AACACCATAA CTATCTGTTG TTACAAATGC ACCAAACGCA 2100 

CCTCCACCAG CTACATTAGA TGGGTCAGCA TTCGCCTTTG CAGCTGAATT TGGTTTAGAT 2160 

GTATTGTGAT ACGTATCCAA TTTGAAGCCA AATGCGTTAC TTAAGCCACC AATACCTACT 2220 

GCGGCACCGT TTAACCCTGT TTCACCTAAT ACACCTGGTG AAAAGGCAAA ACCGATACCA 2230 

TCTCCACCAT TTCCATGCCC TTCATATTTG TTACCTAAAT TTACTTTTCC AGAAAAATGA 2340 

35 AAACTCTTAT TAGAGTCAAT ACGTGTTCCT AATGTAATAG CACCTTTTTG GCTGTATGCA 2400 

TCCTGTGTTA ACGTCACAAT ACCGGTACTT TGATCATAGG TAGCATTACC TGACGTTGTC 2460 

ATATATTGTT TTAAGTTATC TTTATTAACT GTAATTGTAT TAGCAGTTAC TGCGGTTGTC 2520 

'^O GTCgCTGctG ACGCAAATGT TGACATAGCT AAGCGACTGA AAGTTCGAAG TTTTACTGGT 2580 

GCGGTGCTAG TTGACGTTGT GCTAGTTTTG TTTAAGTTGA CCGAAGATGG CGTTGTGCTT 2640 

TGTGAAGTGT TATTTGATGC AGTACTTTGA TTTGTTGATG TATTAATTGG TTGTTCTGTA 2700 

CTTGAAGTTG AAGCTACAGA TTTAGTATCA GAACTTGATG TAGTATTCTT TGAGGATGTT 2760 

GATTCTGATG TAGATGTCAA TTTCTCTTGT TGATTGCTTG TACTATTAGT TGTCGAAGTG 2820 

ACCTTTTCAG ACTTTTCACT TGAGACTGTG TCACTATTTG ATGTTTGTAC CGAACTACTA 2880 

TTTtTCGTTA CACTTGTGGA ATCGGCTGTT GATGTTGATG CTTCGATTGT CGTTGAGTTT 2940 

TGATTACCTA CTGTTTCACT TTGTGTGTTT AATTCAGAAG TTAATGGTGC ATCAGAAGCC 3000 

55 



30 



45 



50 
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GTTTTCAGTC CGTATCCCGT CATTTTTTTA 
CTATGACTAA TAAATGGTAG CCCCATAATT 
TTTACCCAAT TTTTTCCAGA TTTATAAAGT 
TCATGAAATG CTTTCTGTCT TTTACTCATG 
TTAGATTATA ATATATGCCA CTATTCAATT 
TCATTTTGTT AAAATTTGTA AAAATTCaTT 
TTTTTAAAAT TACTTTTTCT CGTTTATGCG 
TTCGCTTTAX GTTTAATCAT TATAATTGTT 
ATCTATACCA TCCACCTTTT ATTTATAAAT 
TATGCAAAAT ACATCTTTAA TATTAAAGTA 
AATATATGTG TAATTCTAAA AGATTCTTCT 
TTAACATTTT CATTTATA7A GCGAAAAAAT 
GATGCATTGA ATTCACTAAA ATGATTAAAT 
GAAATTTCTT. CCTTCTAAAC CTGCTAACTC 
AAATATCTCA TTCACTACTG TGTAATCGTA 
CTTAATGTCC AATTTACCAT TATCAAGAAT 
TCTTCCTATA ACAATATCTA CGGTAGATAC 
AACGTACTCA CATTCAAAAT GAACTGGCGA 
ACATTTTTCC TTTGTTACAC CTGCAAAATT 
CGATGATAAA TTAACTGCTT CTCTTAAATC 
TGTCTCTTCA GCATTTTTCA CTGTATCTTT 
TGCTGCGAAC ATAACCATAG GCGGATCCCA 
TAAATTATCT TTCCCATCTT TCGATACAGT 
ACTACTTTTA AATGGGTCGT GCGGTAAACC 
ATTCATACTA TCTTCACCCC TTATAAGTAA 
AGCGTCTAAT ATAAATAAAC AATTTATTTA 
TATAATTTGC GTTCTTGATT CGAAAAATTC 
ATATCTTTTG TAAATTTAAT TAATTATAGT 
AAGTGAAATT GAAAAAGACA GCTATTATGC 



CTAATGCTTT GATTATCTTG ACTCACTAAA 
TTGAACATTT CTATTTCTTT AATTCCGGAT 
CTTACTCTTG TTTTTTCGTT TGCTAAGCTG 
TAATAACTCC TTGTATTATC TTTACATTCA 
TAATACAACT CTTTTTTGAT ACAAAAATAC 
TTTATTCGTC TAAATGTAAT CGTTTTCATA 
TATAATCTTT TTTTATATAA ATTTGGCTAA 
TCGTTTTTAA AATAATTATT GTATTAATAT 
AGTTAATTTA CAACTAAACG ATAAATATTA 
ATACCAATAT TTTTTCAATA. AACCTAGTGT 
TTAAAAATAT AAATACCACG ACATATTGCT 
GCATOGCTAC TAAGTTGAAT GTTTAGTAAG 
TACTTATATC TTTTCATCTG ATTGATTATC 
TTCTTTAGAA GCTGCAGGTG CTTTCATTTC 
ATATCCTAAT CTGGCAATAG GTTTAATCGA 
AACCTTATCG TCAATATGAA CTTGGGCAAC 
TGGATCTCCA GTTGGAATAC GAATCGTTTG 
TTCTTTTACA CGATATCCTG GAGCTTCTAT 
AAATTCATCC TCTTCTGGTG GCAATGCTTT 
ATACGTTGCC ATATTCCACA CAAACCAACC 
ACGTTCGTGA TCACCAAGAA CGGATTGATT 
AGTTAAGTTT TGATACTGAC TATAAGGCGC 
AGAGATCCAC CCTATTGGAC GTGGTACTGT 
ATGACTTCTT ACACCTTGTT TTGGCXjAATA 
TTACATTTAA GGTTACGCCC TCTTTACATA 
TAAGTAGAAA CTATATATGA CGTGGTTGCT 
AGATAAGGAT TTATACAATT AATATTTATG 
TACTTCAATC ATGATTAGTT TATAATAATA 
GATGAGCGAA AAACTTCAAG TAAAACAAGA 
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TAAGTTCAAA AAAGAATTCA AACCTGTTAT GCACTTAAAA GGTGATGCAT TCAATCAACA 
GTTACAATCT TTGATTAACA AATATCCACA AATACAAAAA AATATGAAAT CAGAGTTCAT 
TGCTTATTAT GATAAAGAAA AAAATAGAGA AACAGTAAAA AACTATGCTT GGAACCTTCA 
AAAATCTATA AATGACATTA TGCAATCATA TCCTAGCACA AAATTTGTAC AGTTTTATAA 
AAGATGATGT TTCCCCGTCA ATGGTAGATG GAAATGGCCG TTTAAAATCG GGATACTAAT 
GTATTTCCAT C 

(2) INFORMATION FOR SEQ ID NO: 265: * 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3589 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



4920 
4980 
5040 

5100 
5160 
5171 



20 



25 



30 



3$ 



40 



45 



SO 



(Xi> SEQUENCE DESCRIPTION: SEQ ID NO: 265: 
CTACACACTA AACCTATTTC AGTTATGGGT GGTACAGTGA TTCTCTTTTC ATTTTTAATA 
GGTATTTGGA TTGGTCATCC TATTGAAACA GAAATCAAAC CACTTATTAT TGGTGCGATT 
ATTATGTACG TACTTGGGCT TGTAGATGAT ATCTACGATT TGAAACCGTA TATAAAATTG 
GCTGGTCAAA TTGCCGCTGC CTTAGTAGTT GCTTTTTATG GTGTGACTAT TGATTTTATT 
TCGTTGCCAA TGGGTACAAC GATTCATTTT GGATTTCTTA GTATTCCAAT TACTGTGATT 
TGGATTGTTG CTATTACAAA TGCAATTAAC TTAATTGATG GACTCGATGG TTTGGCGTCG 
GGTGTTTCkG CAATCGGACT CATTACAATA GGGTTCATTG CAATTTTACA AGCTAATATT 
TTCATAACGA TQATTTGTTG TGTTTTATTA GGCTCTTTAA TTGGGTTTTT ATTTTACAAT 
TTCCATCCTG CCAAAATATT TTTAGGTGAT AGTGGGGCTT TAATGATTGG ATTTATCATC 
GGATTCCTTT CTTTACTCGG ATTCAAAAAT ATTACAATTA TTGCATTGTT CTTCCCAATT 

GTTATCTTAG CAGTTCCATT CATTGATACT TTGTTCGCAA TGATTCGACG TGTGAAAAAA 

« " • •• . • 

GGGCAGCATA TAATGCAAGC TGATAAATCG CATTTGCATC ATAAACTATT AGCTTTAGGC 
TACACACATA GACAAACAGT ATTATTAATC TATTCAATCT CTATTTTATT TAGTCTTTCG 
AGCATTATTT TGTATGTATC GCCACCATTA GGTGTTGTAT TAATGTTTGT ATTAATCATA 
TTTAGTATTG AATTAATTGT TGAATTTACA GGATTAATAG ATAACAACTA CCGACCAATA 
TTAAATTTAA TTAGTCGTAA GTCATCTCAT AAAGAGGAAT AGGGAATGAA AGCATAGCTG 
TATGGGATAA TTTGTATTAT ATGGCTTTAC TCTTTACAAT TTTTTTGTAT TAAATTTCAA 



60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
840 
900 
960 
1020 
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ATTTACCGTC 


TTATGATAGT 


GCTTTTTATT 


TTTATTCAGT 


TGGTATATCG 


AAAGGTAACT 


GCTTTGGAGT 


TTCTTCAGTC 


AAATCGAAAT 


TTCCTGCAGT 


CATTTGATTT 


AAAAAGTTAA 


TAAACGCTTC 


ATAGTCACTT 


TTAACGACAT 


CGATATAGTA 


GCTTACCTTA 


TCAGTGTAAG 


TTTGGTTTCT 


TAACATAAAA 


TGAGTTGAAG 


CTAATTCATA 


TTCAAATTTA 


CCAGTTTGAT 


CATAATTCAG 


TGTTACTATA 


CATGGTACTG 


CTTCTCGTAG 


TTCGACACGC 


CCGATATCAT 


AAATGACGTC 


TCTAACAGCA 


CCGCTATAGG 


CGCGAATTAA ACCGCCACCA 


CCTAATTTAA 


TACCACCAAA ATATCTTGTT 


ACTACGACAC 


ACGCATTATG 


aACATCGrQC 


TTTTTTaATA 


TGTCTAACAT 


TGGGaCACCG 


GcAGTTCCtG 


TCGGTTCACC 


ATCATCATTC 


GCn'rrri'GAA 


TATTCATTtC 


AGGTCCAATA 


GTATATGCAG 


AACAATTATG 


AGTGGCATCT 


TTATGTTCTT 


• TTTTTATTGC AGCAATAAAT 


GCTTTaGCTT 


CATCTTCATT 


TTGAACAGGT 


TTGATATGAG 


CAATGAATCT 


TGATTTACTA 


ATCACATTTT 


CAATAATGTG 


TTCTTTTTTA 


ACAGTAATGA 


TATTTTGTGT 


CATAATAACT 


CCTTAATTCA 


TAAGCTTAAG 


ATTATTTAAT 


CTTCATTATA 


CACTGAAAAT 


GACATGACTA 


TAAATCGTTT 


GATTGCCATT 


TTCTTTTTAA 


CTGAAATATT 


GTATCATTGC 


TATGAGTATA 


TTTTAGGAGG 


ACGACTATGA 


AAATTGCTGT 


GATGACCGAT 


TCTACAAGTT 


ATCTGTCGCA 


GGACTTAATC 


GATAAATATA 


ATATTcAAAT 


AGCGCCATTA 


AGTGTGACTT 


TTGAAGATGG 


CAAGATTATA 


CCAGAAGAAA 


AAGTTCGTAC 


TAAAAAGCGT 


GCCATTCAAA 


CATTAGAAAA 


GAAAGTATTA 


GATATTGTAA AAGACTTTGA 


AGAAGTAACT 


TTATTTGTCA 


TAAATGGAGA 


TCATTTCGAA GATGGTCAAG 


CGTTATACAA 


AAAGTTACAA 


GATGATTGTC 


CTTCAGCTTA 


TCAAGTAGCA 


TACTCTGAGT 


TTGGTCCAGT 


TGTTGCAGCA 


CATTTAGGTT 


CTGGTGGATT 


AGGTTTAGGC 


TATGTTGGCA 


GAAAAATAAG 


ATTAACATAA 


TTAp^AAATT TTAATAAAAG 


AGTCTATATT 


GTAATTGGAA 


ATTATCTCTC 


GTATACATGG 


CTTTAAATGT TCATCATTTG 


AAAGCCAAAA 


TGCTAAAGAT 


ATAAGAAAAT 


CATTATAATA 


TTAGGCTCTT 


TTTTACGTTG 


AAATGAGGTT 


TTAAGCATTA 


AACATTACGG 


GAAATTAATT 


CATCCTCATA 


CTTCACTTAC 


TAATGAAAAA 


ATTAAAAAAG 


AAGTAACAGG 


TGTCATCAAA 


CAAAATTCAA ACTATTATTG 


TGTTCAATGT 


GAAAGTACAA ATCCAAAGCA 


TTTTTATCAG 


TATGATTCCT 


CAGTACATTC 


CAAGAAAATT 


GTATATTGCA GAAATTGTAT 


ATCACTGGGT 


CGAATGGATA ATGTAACAAG 


ATATAAAATA ACAGAGAGTT 


CGCAAAGTTC 


ATCACAAGCA 


TATTATCATC 


TCTCATTTGA 


ATTGTCGGAA 


CAGCAGTCTT ATGCCTCAGA 


ACATATTGTT 


CGAGCCATTA GAAAGAGACA 


AACGATTTTG 


TTATATGCCG 


TAACAGGTGC 


AGGTAAGACA 
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TCACCAOGTG 


TAGATGTTGT 


TGTAGAAATT 


AGTAAACGTA TTAAAGACGC ATTTCTTAAT 


2940 




GAAGATATAG 


ACATACTACA 


CCAGCAATCA 


AGACAACAAT 


TTGAAGGGCA 


TTTTGTTGTA 


3000 


9 


TGCACAGTGC 


ATCAACTTTA 


CCGATTCAAA 


CAGCACTTTG 


ATACTATTTT 


TATTGATGAA 


3060 




GTCGATGCCT 


TTCCTTTATC 


AATGGATAAA 


AATTTACAAC 


AAGCATTGAA 


GTCATCTTCT 


3120 


10 


AAAGTTGAAC 


ATGCAACAAT 


TTATATGACA 


GCAACACCAC 


CG AAACAACT - 


TCTGTCAGAG 


3180 


ATTCCCCACG 


AAAATATAAT 


TAAATTGCCA 


GCTCGCTTTC 


ATAAAAAATC 


ACTTCCAGTT 


3240 




CCTAAATATC 


GTTATTTCAA 


ACTTAATAAT 


AAGAAGATTC 


AGAAAATGTT 


ATACCGAATT 


3300 


IS 


TTACAAGATC 


AAATTAATAA 


TCAACGTTAT 


ACACTGGTGT 


TTTTTAACAA 


TATAGAAACA 


3360 


ATGATTAAAA 


CATTTTCGGT 


TTATAAGCAG 


AAAATTACTA 


AATTAACATA 


CGTCCATAGC 


3420 




GAGGATGTTT 


TTCGCTTTGA 


AAAAGTTGAA 


CAATTAAGGA 


ATGGACATTT 


CGATGTCATT 


3480 


20 


TTTACTACGA 


CAATATTAGA 


ACGTGGATTT 


ACAATGGCAA 


ATTTGGATGT 


TGTTGTTATC 


3540 




GATGCACATC 


AATATACTCA 


AGAGGCTTTA 


ATACAAATTG 


CTGGACGTG 




3589 




(2) INFORMATION FOR SEQ ID NO: 266: 








25 

30 


• . (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1017 base pairs 
(B> TYPE: nucleic acid 
(C) STRANDEDNSSS : double 
(0) TOPOLOGY: linear 




1 

.. 


- 




(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 266: 


• • 




35 


TTTCCAAGAA GGcTTgAAAA AtGTTwCaAG TGGTGCGAmC 


CCAGTTGGTT 


TACGACAAGG 


60 


TATCGACAAA 


GCAGTTAAAG 


TTGCTGTTGA 


AGCGTTACAT 


GAAAATTCTC 


AAAAAGTTGA 


120 




AAAI^AAAAT 


GAAATTGCGC 


AAGTAGGTGC 


GATTTCAGCA 


GCAGATGAAG 


AAATTGGACG 


180 


40 


TThTPkTTTCT 


GAAGCTATGG 


AAAAAGTAGG 


TAACGATGGT 


GTCATTACAA 


TTGAAGAATC 


240 




AAATGGACTA 


AACACTGAAC 


TAGAAQTGGT 


TGAAGGTATG 


CAATTTGATC 


GTGGTTATCA 


300 




. V* ... ' - 
ATCACCGTAT 


ATGGTTACTG 


ATTCAGATAA 


AATGGTTGCT 


GAATTAGAAC 


GCCCATACAT 


360 


45 


TTTAGTAACA 


GATAAGAAAA 


TCTCGTCTTT 


CCAAGATATC 


TTACCTTTAT 


TAGAACAAGT 


420 




GGTTCAATCT 


AATCGTCCAA 


TCTTAATTGT 


AGCTGATGAA 


GTTGAAGGCG 


ATGCATTAAC 


480 




AAATATCGTG 


CTAAACOGTA TGCGTGGCAC 


Arn'ACAGCT 


GTTGCAGTAA 


AAGCACCTGG 


540 


50 


TTTTGGTGAT 


CGTAGAAAAG 


CGATGCTTGA AGATTTAGCT 


ATTTTAACTG 


GTGCGCAAGT 


600 




GATTACTGAT 


GATTTAGGCT TAGATTTAAA AGATGCATCA 


ATTGATATGT 


TAGGTACTGC 


660 



55 



1075 



10 



15 



25 



30 



35 



40 



45 



SO 



EP0 786 519 A2 

CAGCATTGAT GCACGTGTTA GCCAATTGAA ATCTCAAATT GAAGAAACTG AATCTGACTT 780 

TGATCGTGAA AAATTACAAG AGCGCTTAGC TAAATTAGCA GGTGGTGTTG CAGTTATCAA 840 

AgTAgGTGCA GCAAGTGAAA CAGAGCTTAA AGAACGTAAA TTACGTATTG AAGATGCATT 900 

AAATTCTACA CGTGCAGCAG TTGAAGAAGG TATTGTTGCA GGTGGTGGTA CTGCATTAGT 960 

AAATGTTTAC CAAAAAGTAA GTGAAATTGA AGCTGAAGGT GACATTGAAA CAGGTGT 1017 
(2) INFORMATION FOR SEQ ID NO: 267: 

(i) SEQUENCE CHARACTERiSTICS: - ^ 

(A) LENGTH: 1409 base pairs 
<B) TYPE: nucleic acid 
<C) STRANDEDNESS : double 
(D) TOPOLOGY: linear 



20 (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 267: 



TTATGATTAT 


TTCGATTCTT 


TTAGCGTATG 


60 


TGTTATTAAT 


GGTCATTATC 


ATTTCAACTA 


120 


AAGAAATGAA 


TATTATGAGA 


ACAACTATAG 


180 


CGGACTTAGT 


AACTATGATT 


TTATTAACGG 


240 


GTACAATATG 


GTTAATAGGT 


ATATTAGTTG 


300 


TTCAATTTAA 


AAGAATGTCA 


TTTTTACAAA 


360 


TTCGTGCGGT 


ATTTGCATTA 


ATAATATTAT 


420 


AAAATATATT 


AGGTGCATTC 


TTAGCAGGTG 


480 


AAATGGTTGA 


AAAGTTAGAC 


TCATTTGGTT 


540 


TGGnTGGTGT 


AGATTTAAAC 


ATACCTTCAT 


600 


TACCGATTTT 


AATCGTnGCA 


TTTATCATTT 


660 


GTTGGTTTGA 


TATGAAAACA 


ACGATTGCAT 


720 


TCGTGATAGC 


TGCAGCCAAA 


ATTTCAGAAA 


780 


GTATATTAAT 


TTTAAGCGCA 


GTCATTACAT 


840 


TGTTTCCAGT 


TCCAGATGAG 


TTTAACCGTA 


900 


AATTAACGAT 


TCCTATAGCG 


CAAAATTTAA 


960 


ATCGCAAAGA 


CITGAGTGAT 


CGTCGTCAAT . 


1020 


CTGATTATGA 


ACAAGATGTT 


TTAGAACGAC . . . 


1080 
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AAGTTGCTAA ATTAGCCAAA GCACATCAAG TTGAGCGTGT CATTTGCAGA CTTGAAAGCA 
CAACGGACGA TACAGAGTrA GTTGATTCAG GTATTGAAAT TTTCAGTAGC TACTTAAGTA 
ATAAAATCTT ATTAAAAGGT TTAATTGAAA CACCTAACAT GTTGAATTTA TTAAGTAATG 
TTGAAACX3TC ACTATATGAA ATTcfAAATGT TAAATTATAA ATATGAAAAT ATTCAATTAC 
GTAATTTCCC ATTCGGAGGA GACATCATC 
(2) INFORMATION FOR SEQ ID NO: 268: 

Ci> SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4702 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



1200 
1260 
1320 
1380 
1409 



20 



25 



30 



35 



40 



45 



SO 



(xi) SEQUENCE DESCRIPTION: SEQ. ID NO: 268: 
AAAGAGGGTT TTTTACTACT ATAATCCATC CTTTAATGGA ATTCCATTTG TCCCTTTGGC 
CCGTTCATAA CCATAGGAAA ATATATGCnG nAATCATTGA TAGTAAATAC ATCAATAATA 
CGAATAATGT CGGTGAAATC ACGTCCGTAT TACCATTATT AGCTAAAACA TTTTCCAAGT 
TTTCTTTTGA ACCGGATACT CATAAATGCT TTTAATGCtlT GGTTTTGTCT GTCGCCATCT 
TTAGAATTTG TAATACTTTT TTAAATTCTT TAGCGAACAA CTCATTATCT TTATCGTTTT 
TAGCCATTTG ACGATTCAAA TCGTTAGCTC TTACGCCTAA TGCTCGACCT GTCGCATGTA 
GCTTATTCAC ATTATTGTCG ACTTGATTTA ATTGGCCACT AACAGAATCT GCAATTGATT 
TTGATTCTTG TGTATCTGAT AGCAATTGCG TACTCTTTTC AGAAATTCTA CTAATTTCTT 
TATCTAAATT TGAAGACATC GTATTAAATT CATCATTTTT GCCTTTATCA ATTTTTGGTT 
CTTGTGGCTC TTCAGCAAAA GTCTTTTTAA CGTTTTCTAA CTGATCAATC AGCTTGGAAA 
TATCTTCTTJc ATTTTTTGTT gTATTCTTTT TGTTATTTAA AATGTCATCA ATCAGTTTGT 
CTGAGTTTTC TTCCATTGAA TCAATTTGaT GTAACACAGC TACTTTATCG TCTTTGAAAC 
TTTCCATGTC ATTGATAACT TGOTCAACCA TCATATCAAT TAAACGTTTG TTGTCGAATG 
GTTTATCTTC tCTGCCTTTT GTATCTGTGT ACATTTTATA ATGCGCATCA AACCTAGATA 
ATGCACTCAA TTGCTGGCTT AATGCATCTT TCGATAAGCG ACCATCaAGG TTATGATTCA 
ATGTTACATC CACAACACTC GTTGC1TTCT TATCATTTGG TTCATCTTGA CGATTTGCTT 
6TCCAAATAA CAATTGTAAA TGCATTGTTT TATCTTTTAA GAAATCTTTC TCAGCATCCT 
TTTTCAATTT AGCAACGCCA TTGACTTCAA CTTTATATTC CTTGTTAGAT GTATCGAGTT 



60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
840 
900 
960 
1020 
1080 
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TAAAATGAGG AtCTGTTGCA ACAGTTAATT GATTAATATC ATTAC TT TT A ATCGTTTCAG 1200 

TACGTTGCAC TTTGACACCA TCATTAATCA AACTACTTGT GTCTTGCGCA ACTTGGTTAT 1260 

* CX3TAATCTGT TAAATTAATG TGTTCTGCTA ACGGTTTTTT CAAATTATAT TCATTTTTAT 1320 

AACGTTTTGC TTCTTTGACA ATTGCTTCGT ATTTATTAGC TTCATCCTCA TTTAAACCTG 1380 

CAGCTATAAA GTCTTGTTTA GACATGTTAT AGATAAATGT TGTATCTGTA TGAGGTTCTT 1440 

10 

TGACAATATC ATCATGAAGT TGTTTCTCTA AGTTTTCAGC GAATTGAGCA TTGTTCATTT 1500 

TAATGCTATT TAGCGCATCT TGTAAGTCTT TGTTAlTrGC AAGCTCATCT TGCAGTGATT 1560 

CTGTTAATTG CTTACGATAn TCTTCAATCA TACCTTTTGA AAATGGTGAC TCTTGTGATT 1620 

IS 

OPJiTGHTTTC TCTTAATTTA TCTAAGTTTT CTTTAACAGT TTGTTTATAT TCTTCTTTAC 1680 

CTGTATCTTG CATACTTGAT TGTTGATCAA TTTGGCTGTC CATCTGTTTT AATGCATTGA 1740 

20 TATAGTTATC AAGTTCCACG CTATCTTTTT GCGATTTATA ATCTTGTAAC ATTTTATCCA 1800 

TCGCTGTATT GTGCTCGTCA AATAATGAAT TTTGTTTTTC AATTAAAGTC GAAACATTAT 1860 

AATCTGTGTT CACTCTGAAC GTATCTGAAT TCGCACTCAA TAATGATTTA TTGTATGTTT 1920 

25 • GGAACCATTT TGTAATGTCT TTGTTTGCAG AAATTGAATT TACAAGCGTA TCTGTAAATA 1980 

ATTCCGGGAA GTCGTTAATT GGATTTAATA AGTAATTCGA GAATTTACTA TTCACACCAT 2040 

GTTCACGCGT CATAATAGCG CCAACATTTT TTTGTGCATT ATGTAAATTA TCAATGATGC 2100 

30 

TTGTTAAATA AATTTCGACT AAGTTTTTGT TAAAGTCGTT AAGTACATTA CTTACAACTT 2160 

TTTCTGTGTT TTTAGCTACT TCTTCTTTTT GTCCTACAGC T G TTTT A TAC TGTAGCGATA 2220 

TTTTCGATGG TGTTTTAGCG TCTAATTGCA TTGCCAATTT TGAAAAGTTT TCTGGGATAA 2280 

35 

CAATCATGAC TTGGTATCCA CCATTTTTCA AACCAGACTC AGCAACGTTT CTTGTTACTG 2340 

TTTCAAATTT ATAGTTTTTC TCATTTGCTA ACCTTTTAAT AAATGCTTGA CCCAGCTCAA 2400 

CTTTTTTACC GTTATATGTC GTTGGTTGAT CCTCGTTAAC AATTGCGATA TGTATTTTAT 2460 

40 

TATTTTTATT ACTTACACTT TGGGATCCTT TTTCTGATTG ATCTCCATAT TTTGTTTGAA 2520 

CAAAAAATAT CATACTAACT ATGGCAATTA TAATAATTAA AGTGACAATT AATGCATAAA 2580 

4S TCCAATTTTT CTTTTTCATG CTTATTTCCT TTCAGTTGTT TTCTTAAAAA AATGATAAGC 2640 

AAAGCCACAT TAGAAAATGT GACTTTGCCA ATTTCAGAAT GCTTATTGCA AACCGAAATT 2700 

ATTAGAAAGT TGTTGGTCTT GTTCTTGAAC GGCATCAGCA GTGCtATTcA ATTGTTGTTT 2760 

so 

AATTTCTTCT AATAATTGTO CAAATTTTTC TACTTTAGGA CTAAGTTGTT GGAATTGCTC 2820 

TTCGAAACGG CTGAAAGCTT GACCTTCCCA GTTCGCTGCA ATTTCACCTt GTGCACGkGT 2880 

55 



1078 



EP 0 786 519 A2 



10 



IS 



20 



25 



30 



35 



40 



45 



SO 



TCTGATTTCC TCTGGACTCA TCTTAATCAT TGCCATAACT AGAAACCTCC TGAATATTTT 
AAGTTTATCa AAACTTTTTA GGGACACTAT TTTTTGAAAA AGTGCTCCTT ACTCAAATAA 
TATATAAATT ATTAGTATAT GTATATAGTt TTTTAAGTAT TTTTAGCTTT TTTAAAATAA 
ATATATTGAA TATAACCATA TATTTTTAAT TAACCATTCA TTTTTGTAAT ATAAATGTGT 
ATACTAAAAT TAAATTAAAT ACATAAAGGA TTAAATGGTT ATTATGAAGA AAACAATTTT 
ACTGACGATG ACAACTCTTA CTTTATTTAG TATGTCGCCT AACTCGGCTC AAGCATATAC 
GAATGATAGC AAAACATTAG AAGAAGCAAA GAAAGCACAC CCAAACGCAC AGTTCAAAGT 
GAATAAAGAC ACCGGCGCGT ATACTTATAC ATATGACAAA AACAACACGC CAAACAACAA 
TCATCAAAAC CAGTCAGGTA CAAACGACAA TCATCAACAC GCAAATCAAC GTGATCTTAA 
CAACAATCAG TACCATTCTT CATTAAGTGG TCAGTATAOG CACATTAATG ACGCAATTGA 
TTCACACACA CCGCCTCAAA CGTCACCAAG CAATCCTTTG ACACCAGCAA TACCGAATGT 
CGAAGACAAT GACGATGAAT TAAATAACGC TTTTTCAAAA GATAACAAAG GGCTTATTAC 
AGGCATCGAT TTAGACGAAT TGTATGACGA ATTACAAATC GCCGAATTTA ATGACAAAGC 
AAAGACCGCT GACGGTAAAC CTTTAGCATT AGGTAACGGT AAAATCATTG ATCAGCCTCT 
TATGACAAGT AAGAACAACT TATATACTGC TGGACAATGT ACATGGTATG TCTTTGATAA 
ACGTGCCAAA GATGGACACA CGATTAGTAC ATTTTGGGGA GATGCTAAAA ACTGGGCAGG 
CCAAGCTTCA AGCAATGGCT TCAAAGTAGA TAGACACCCA ACACGAGGAT CAATTTTACA 
AACAGTAAAT GGTCCATTTG GTCATGTAGC CTACGTTGrA AAAGTTAATA TTGATGGAAG 

* A 

TATTCTAATT TCAGAAATGA ACTGGATTGG TGAATATATC GTTTCATCAA GAACCATCTC 
TGCTTCAGAA GTTTCATCAT ATAATTACAT CCATTAAATT AATCATGACA TCAATAAAAA 
GCGACCAGTT CGCAGTTTAC AATTCGTAAC ACTGCAAAAT TGGTCGCTTT ATTTTGTATG 
TTATTCGATT ATAAAATTAC AAAGAAATGT TCTCTACATT CCCCATTAAT CAAAATCGTT 
TACQAAAGTA TAATTGTAGC TATAATAATC CAAGTCGTAA CAACTAGTGG CACTATCGTC 
TTGAATAAGA ATATACCGTA TTTTTTCTTG CX3ATATATAT CCAGTACTAG CCAAATTAAA 
ATGATTATAA CACCAACAAA AATAAATACA GGATTCATCG ATATAGCATC TGCCTGTAAC 
TCAGGTTGCA TTCTTAATTT AGTGATAATT AACATCACTA CTGAAATAAT GAAAAAGTAG 
ATACCTCTTA TCTTTGATGT CTGTAAATCT AATTCCTGCT CTTCAATGAC CTCTTTAGAT 
TCACCCAATT CTTTTGCAAT CAAATAATTT ACTACCTTAG GTTTCACCCA TAAACACTTA 
ATTGCAAAGT ACATAAAAAT ATATGATCCA GTATCCATAA ACATTAAAAA GTTGCTTAAA 



3000 
3060 
3120 
3X80 
3240 
3300 
3360 
3420 
3480 
3540 
3600 
3660 
3720 
3780 
3840 
3900 
3960 
4020 
4080 
4140 
4200 
4260 
4320 
4380 
4440 
4500 
4560 
4620 
4680 
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(2) INFORMATION FOR SEQ ID NO: 269: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2004 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



10 

' (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 269: 





ACAAAAAATT 


CACCCTCATT 


AATATTGAAA 


CTAATGTTAT 
ACTTTGCCAC 


CGACAGCAAC ATGTTTGCCA 


60 
120 


IS 


TAACGCTTAG 


TTACATTTTT 


AAACTTAATC 


crcrrrnTT ctcatagcat 




AAAACCGAGA 


TTATATGTAT 


GTATTCCCTA 


TTTAACCACG 


TTTATTACAA TTTTCAAATT 


180 




TAAATGATTT 


ATCCTTGAAC 


TTTTTTAATA 


AAATAATGAA 


TAAwAGGwAA TCwCCAGTTA 


240 


20 


AGAAATAGTG 


TTATTTTACC 


TTGAATTCAA 


AAAAACACCC 


AGTAAAACAA GGAATGCTTA 
CGTTtCTAAA AATGCTGGAC 


300 
360 




CTAGGTGTCT 


TCACTATACT 


TTGGCTTTAT 


AATTTTGAAT 




AATAATGTTT 


TAATTTGTAA 


CTACCTACGC 


CATCtnATATT AATCATATCT TGTTTCGAAG 


420 


25 


CAGGCTTACG TTTAGCAAAT 


TCCTCCAACG 


TGTAATCAGA AAATATACTT ACAGGTGCTA 


480 




TCGTTAATTT 


GTCACTTAAC 


TTTTTACGAA 


CTTCTACCAA 


CTGACTGAAT AATACTCGGT 


540 


30 


CAACCCCTTC 


AACCGTATTT 


ATAAATACTT 


TTTCAGTCGC 


TTTTTGCTTA AATGGTGTTG 

• - 


600 


TGAATACTTC 


TACTTCATTA 


CTGAGTAATT 


TTTTAATTGA 


AGTATCACAC ATTAATATTT 


660 




CGTCATTTTC 


ATTTAAGAAC 


CCTTTGAATC 


TTAATTCATC 


TATTAAGTGA CiTAATTCTG 


720 


35 


ATGTTGTGTA ACCTTTCATT 


AAACCATGGG 


TTGAAATTTG 


GTCATAACCT TTATACTTAA 


730 




TATAATCTGk 


TGACTCTCCT 


CTTAACACTT 


GAATGATAAC 


ACTATAACTC TCTTGTTGTT 


840 




TCATACGAGC GATGCAACTA 


ATAATCATCT 


TAGCTTCTTG 


TGTCATATTA TATGATTTAT 


900 


40 


CTTGTTGAAC 


ACAATTACTA 


CATTGTTCAC 


ATTCTTCTAA 


TTTTTCATTC GGTTCAAAAT 


960 




AATGGACAAT 


TGTTGCTTCT 


AGACATTTTT 


TTGTTTTTGT 


ATATTGAATC ATTTTAGTTA 


1020 




ACTTTTCGCC 


CATTTTATCT 


TTATAGTCAT 


CATCAGCTTG 


AGAGACTGTT ATAAAATACT 


1080 


45 


CGTGTAAATT 


GATAtCGCGT 


TCGCTAAATA 


ACAAAATACA 


TTCACTTTTC AACCCGTCAC 


1140 




GACCTGCACG 


ACCCGCTTCT 


TGATAATAAG 


ATTCTAAATC 


TCCAGGCATA TTATAATGAA 


1200 




TAACAAAGCG 


TACATTGGAT 


TTATCAATAC 


CCATACCAAA AGCATTTGTA GCAACGACTA 


1260 


SO 


CTTTAACACG 


ATCAAATAAG 


AAATCATTCT 


GCGCTTCTTC 


TCTTTCTTTA TTGCTCAAAC 


1320 




CTGCATGATA TATAACACIT. 


TCAATTTTCT 


GACTTTCTAA 


GGCTTCTTGA AGCTCTTCAA 


1380 
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70 



15 



20 



25 



CCAATATAAA TTTTTGACGT TGATAAGTAG GATTTACTTT AAAAATTAAG TTTCTACGCT 
TAGTACTCGT TTTAATTTGA TCAGTTTGAG CGATATTTAA CTTTTCTCTA ATATCTTGCT 
GTACTTCAAC CX3TGGCAGTT GCTGTCAACG CTATTATTGT AAAATCTTGA GGTAACGTAA 
ATACTTTTGA AATAACATTT TGGTAACTCG GCCTGAAATC ATGACCCCAT TTAGAAATAC 
AATGCGCTTC ATCAAACGCG ACTAAGTGAA TCTTTATACG CTGAAGCATA TTTAAAAAAT 
ATCX5GTTTTC AAATCGTTCT GGTGCAACAT ACAAAAATTG AATTTCTCCA TTTGATAATG 
CTTTTTCAAT ACGTrGTTGC TCTTTTTGAG TCAAACTACT ATTTAAAAAA GCAGCTTGAA 
TTCCCATCGC TTTTAATTGA TCCACTTGAT CTTTCATTAA TGATATTAGT GGACTTATTA 
CAATTGTTGT ACCACCTAAC mATAAACCTG GTACTTGrTA GCmTATAGAC yTACCTCCAC 
CAGTtGGkAA GrCACCAAGC ACAT 
C2) INFORMATION FOR SEQ ID NO: 270: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2244 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOIiOGY: linear 



1500 
1560 
1620 
1580 
1740 
1800 
1860 
19^0 
1980 
2004 



30 



35 



40 



45 



SO 



Cxi) SEQUENCE DESCRIPTION: SEQ ID NO: 270: 
AAAGATTGCT TGCCTTGAGG GTTTATATAT CTGACTCAAT TGCCACATTT TTATCAAGAG 
TAGTTGATAA TACTCATCAT AATTATAGCT AATATTATAT TTTTTTAAAA GATAGTGTAT 
GATTTTCTGG TGTTTGTTGT ATACGTCATT AAATTTCAAG TAGTCATTCT CCAAGTTATA 
CGTATAACAA ATATTTCCGG ATAAAGTTAG AATAAAATAT TTAGAAAAAT CATTCATTTG 
CGTi^ATCGCT AAATTAAGTG TTAAATATAA GACATAAGTA ATTAATTTAA TGTGATATGA 
TGTATTATTA CTTTGCTAAA TAGTAGATAG AACAAAATTT GTAATCGGGA GGTAACAATG 
GATTACGCAC ATTTAAATTT AGAACATTTT TTTGCACGAA ACGACGATTT AGATGTTATA 
AGAGATCGCG CTGATTTCGT GATGATAAAT AACTTCACTA ATGAAATGAT GTATCGTGAT 
GGTCAAATTG AAGGCACGAT TGATTTAAAT CAGTACTATT ATAAAAATAG ATCAAATGCA 
GCAAGTTTTA TTATGATGGA TTATAAAAAA GAAACTAAGT AAACGAACAA AAGAATTTTT 
TGTTTTTTAA TACGTGAATA ATAAGATTAT TGATATAAAG GTTTTCAAAG GTTATACAAA 
AAGATAAAAC ATTTATGATT CGTAGATCAA. CGTAAAGTAA TGTTGATAAA TGGTTTAAAA 
CGTTTCATTT ACATTACTGT TTATTTATGA ATATGTAACA ATGCATAGAT AAAATTGTTA 



60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
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30 
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ACCTAAGAGG TGTGGATATG AATAAACACA AGAAAGGTTC TATTnTGGA ATAATAGGAC 
TTGTTGTCAT ATTTGCTGTT GTCyCaTTTT TATTTTTCTC AATGATATCC GATCAGATAT 
TTTTCAAACA TGTTAAATCC GACATTAAGA TTGAAAAGTT AAATGTTACA TTAAACGATG 

• I 

CAGCAAAGAA ACAAATAAAT AATTATACGA GTCAACAGGT ATCAAATAAA AAGAATGATG 
CATGGAGAGA TGCATCTGCA ACTGAAATTA AAAGTGCAAT GGATAGCGGT ACTTTTATCG 
ATAATGAAAA GCAAAAATAT CAATTTTTAG ATTTATCAAA GTATCAAGGG ATTGATAAAA 
ATAGAATTAA ACGTATGTTA GTAGATAGAC CAACGTTATT GAAACATACG GATGATTTCT 
TAAAAGCTGC TAAAGATAAG CACGTTAAOG AAGTTTATTT AATTTCACAT GCATTATTAG 
AAACTGGCGC AGTTAAAAGT GAATTAGCTA ATGGAGTCGA AATTGATGGC AAAAAGTACT 
ACAATTTCTA TGGAGTAGGA GCCCTTGATA AAGACCCAAT TAAAACAGGT GCAGAATATG 
CTAAAAAGCA TGGTTGGGAT ACACCTGAAA AAGCTATTTC AGGCGGTGCT GATTTCATTC 
ATAAGCACTT CTTATCAAGC ACAGATCAAA ATACATTGTA TAGTATGAGA TGGAATCCAA 
AAAATCCAGG AGAACATCAA TATGCTACAG ATATTAAGTG GGCAGAAAGT AATGCAACAA 



25 TTATCGCTGA CTTTTATAAG AACATGAAGA CTGAAGGAAA ATACTTCAAA TACTTTGTGT 
ATAAAGATGA CAGTAAACAT TTGAATAAGT AATTTGATAA GCTACGAGTT GTTTTTATGA 



SO 



CTCGGACATA CTAAAAAGAC GCTTTCTATC TTGTTTTGAT AGAAAGCGTC TTTTTGCATT 
AGAGAAAACA CATTGATkGA TAAtCCCaCC aATGCAAgTG GGGcAGGACa TCGATAAAGA 
ATTACTTTTT CTTTAGAAAT TAGTATTTCT TATGCATGAG TTTTACTCAT GTATTCCTAT 
TTTTAAGTAC ACATTAGTTA TAGCTAATGA TAAAGAACCA CTACATAATA AATCATTAGT 
GTTTTTTTAT CATTTCTGTC CCaCTCTCAT CGTGATTTGA AATTTTCAAT TGCGATTTTA 
ATTTCATCTC TTACACGTTG GAACTCTGAC CAAGGCTTGC CTGCAGGATC ATCAAATCCC 
CAATGTTCTT TCTTAACATT TGTTGGTAAA GAAGGGCAAT TTACGTCTGC ATCACTACAT 
AATGTAACAA CTAAATTTGA ATTTnTAATA ATATTATTAT CGGATTAAAA TCTGATGGAT 
GATTTGATAT ATCAATGCCT ACTT 
(2) INFOEy^TION FOR SEQ ID NO; 271: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1371 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY : . linear 



900 
9S0 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1600 
1860 
1920 
1980 
2040 
2100 
2160 
2220 
2244 
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ATAAGCAATT TAATTTTGAG TCTACAATGG AGGAATTATC ATCTTTATCA GAGACTTGCC 60 

AACTTGAAGT GTTGGGTCAA ATTACTCAAA ACAGAGATCG TGTAGATCGC AAATATTATG 120 

TTGGTAAAGG TAAAATTGAA GAAATTCAAG CATTTATTGA GTTCAAAGAT ATTGAXGTAG 180 

TCATCACAAA TGATGAATTA ACGACTGCAC AATCCAAATC ACTAAATGAA GCTTTAGGTG 240 
TAAAAATTAT TGATAGAACT CAGTTGATTC TTGAAATATT TGCATTAAGA GCAAGAAGTA - 300 
AAGAAGGTAA ATTGCAAGTA GAGCTAGCAC AACTTGATTA TTTATTACCT AGATTGCAAG • 3 SO 

GCCATGGTAA AAGCCTTTCT CGTTTAGGTG GCGGTATTGG AACTAGAGGC CCTGGTGAAA 420 

CGAAGTTAGA GATGGATCGC AGACATATTC GAACTCGTAT GAATGAAATT AAACATCAAT 4 80 

TGCGGACGGT AGAAGAACAT CGCGAAAGAT ATCGAAATAA AAGAAATCAA AATCAGGTGT 540 

TTCAAGTAGC TTTAGTTGGT TATACAAATG CTGGTAAATC ATCATGGTTT AATGTTTTAG 600 

20 CAAATGAAGA GACGTATGAA AAAGATCAAT TATTTGCAAC GTTAGATCCT AAAACACGAC 660 

AAATTCAAAT AAATGATGGA TTTAATTTAA TTATTTCAGA TACTGTTGGT TTTATACAGA 720 

AACTACCTAC GACGTTAATT GCAGCTTTTA AATCAACTTT AGAAGAGGCT AAAGGTGCAG 780 
25 ATTTATTAGT ACATGTCGXA GATAGTAGCC ATCCTGAATA CCGTACGCAG TATGACACAG " - 840 

TTAATGATTT AATCAAACAA TTAGATATGA GTCATATTTC TCAAATAGTT ATTTTTAATA 900 

AAAAGGACTT ATOTOATCAT GCATCAAATC GTCCAGCAAG TGATTTGCCT AATGTTTTTG 960 

TTTCTTCTAA AAATGATGGT GATAAATTAC TTGTTAAGAC GTTATTTATT GATGAAATCA 1020 

AAAGGCAATT AACTTATTAT GATGAGACAA TTGCGACGAA TAATGCAGAT CGATTATATT 1080 

TTCTAAAACA ACATACATTA GTGACTGAAC TTAAATATGA TGAAATTGAA AATGTTTATC 1140 

GTATAAAAGG ATTTAAAAAA TAATAAAAGG ACGAAATTCA AATGAAAGAT ATAAGTAAGA 1200 

TAGTAGCTGA CGTCGAATCA ACGTTAGCAC CATATTTIAA AGAAATTGAA GAAACAGCAT 1260 

ATATTAATCA AGAAAAAGTA TTAAATGCAT TTCATCATGT CAAAGCAACC GAAAGTGATC 1320 

TACAAGGATC AACAGGATAC GGGTATGATG ACTTTGGACG TGATCATTTA G 1371 
(2) INFORMATION FOR SEQ ID NO: 272: 

^ (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 6035 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNBSS : double 

(D) TOPOLOGY: linear 



30 



35 



40 



SO 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 272 
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. CGTAAACCTA TGCGTTTTAA TATTCTGAAG TTACTTAGTT CATCCTCAGT TTCATCCATT 120 

TGTTTAATAT AAATAATACA TCCAGCTGCT ACTAAAAATG CTAATCCTAA AAATGATGTA 180 

ACAAATATTA GAATACCGTT AGTAGCATcG ACCTCTTTTT TCATTTCATC ATACGTGATG 240 

ACTTTGTCTC CAAACTGTTT TGCAATTGCT TGAGCTTTTT CCTTTTGTGA TGTTTGTTTA 300 

ATATCATATC CATAAAAAGT ATGAACGTTA TTTTGTGTTT TCAACTGCTG ATACTTTTCA 360 

GGACTTACTT CGATGACAGG TGAGTTGAAlG CTTAGATTTA AAGGATAAAC CTTACCTTTG 420 

TCTTCTTGTG TAcACGGAAA GTTTCATTCT . TAGTACCTTT TACTACTAAA TCTTTGTTTA 480 

AATCGATATT AATAATGTTA GGCAGCGATT TTGTATTTGT AATGATGGCA TTGTTGCCTG - 540 

TtAACTTGTT ATTTGCACTT AAAATAGAAT TCX3TG0GACC TGAATCACTA CCATTTTCCA 600 
AAGTAATAAC CTGATCATTA ACATTATCTA CAGTAATAGT TTCX5TAAGCA TTTTTAGAAA . 660 

4 

KS^TMmTG TTGTTGGCTT AGTTTAGTTT CAAATTGTTT AGCATCTTGA GTAGCGACCA 720 

CGTTAAATTC ATTTGGTGCC ' ATAGATGTAA • GGGTTTGATC TGTATTTGAT TTAGATAATG * 780 

CCGCAAAACA CAATACAGTT ACTGTAACTG CAGAAATAAT TGCAATGATA GTTAAAGACA 840 

25 TGGCATTTTT CTTCATTCTG TACATAATAG ACGATGTGAA TACAACATCG GTAATAGATA 900 

CGCGTCCATT TTTTGATTTT TTCAATGTTT TAAAAATAAG TGACACGGAA CTTCTGAAGA 960 

ATAAATAGGC GCCTACAACC GTTAAAAATA AAATGATAAA CGGTGATGTC ATAGCCATAG 1020 

TTAGTGCTTT GAACGTACCA AACATTTCTG TCGCCATATA ATAGCCTAGT 6CAATCATAG 1080 

CAATACCTAA TACGCCTGAA ATAACCTCTG CAGTCGTTAC TTTAGCAGTT GTGGCATCAG 1140 

TTTTAATTGA ATCTTTCATC ATTGATAAGA TACTACGTCT TTTTAGAAAT AAAGCACTTT 1200 

GAAATAAAAT CAGTACATAC GCAATAATTA GCATGAAAAT AGTTAAAACA AGGGCCATAG 1260 

GTTCGAAATG TATCGATAAG TTAATCGATA ACGACATCAA TTTAGATACT ATGGAAAGCA 1320 

ATAaTTGTGC ACCTGCAATG CCACATAATA CACCGACAAC ACCTGTGATT AAAAATACGA 1380 

TCATTtGTTC AAGTGCTAAC ATTTliCAAAA TGTTTTGTCG TGTTAAACCA ATCaACTGAA 1440 

ATAGCGCAAA TTCACGTGTA CGGCGTTTTA CXSrmTAAATG ATTGGCATAC AITAAAAAGA 1500 

45 TGACAATAAT GATAAATAAA AATATTGATC CGACTAAAGC ACCTTTCTTA ATGATGGCCA 1560 

TCGAGTCGTC ATTATTTACA CCTTTAGTAA ACTGTAAGGT TGTAAAACTG AAATATAAGA 1620 

CGATGCTAAA AAATAATGAA AATAAATACA TTGCATAATG TTTTAAGTTT TGTCGTAAGT 1680 

TTTTGAAAAC GATATGGTTA AATGTCATTT GAGACACCAC CTAATACTGA TTGAAGATGT 1740 

ACAATGTCTT CATAAAAGGC CTGTTTAGAA CGTCCTTCCT GATAAAGTTG TGTATGAATT 1800 
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ACCATGACAA TAGTTGTATC AAACGATTTA TTCATTTCTT CCAAACGTTG TAATAGGTCA 
TTTGCACTTT TCGAGTCGAG TGCXSCCTGTT GGCTCATCTG CAAATATGAT TTGTGGTTTG 
TGAACAAATG CTCTCGCTGC TGCAGTTCTT TGTTGTTGAC CACCAGATAA TTCGCTAGGG 
TATTTATTTC CTAGGTCATA AATACCTAAT' GCTGTCGTGA TCGCTTTATA ATTTTCTTCC 
ATTGTTGCCT TCGACATTTT TTGAACAGAT AAAGGTAACA TAATGTTTTC TTTAACGGTT 
AATGTCGGCA GAATACTGTA ATCTTGGAAG ATGAAACCTA ATGATTCTTT GCGGAATTTG 
GCAAGTGCTT TTTGATTAAG TTTATTAAGC TCTTGTCCX3T TAGCAATCcg CTACCGCTAG 
AAATTTGGTC AATTGAACTT AGTACATTTA ATAAGGTTGT CTTACCTGAT CCAGAAGGCC 
CCATAATCGC AACGAATTCG CCTTTTTGTA TGTCAAAGTT AATATCTTTA AGTGCTTGAA 
ATGTGTGCTT TTTACCGTAT GTTTTTGAAA CATGTgCACT GATAATATCG TCATAGTCTC 
ACTCCTTtTG TATTTAATTT CATTTTAAAT AATGTTTGGA GTAGTAGCCT TTATCTAAAC 
TTACAATTCA ATGAATGAAC CTTACAGAGT TGAAArcTAT CGCTACTTAG TAGATTTTTG 
AGTGAGGATA CAGATTCATC GTACATATTA GACAAAAGCA ATGGTGCTTT CTAAGTGATG 
ATGTTTGTGT AAATTGAGAA AAGGGAATTT AATTATTGTA TAATAAATTT TTTGTAAAAA 
TTAAAAGAGG GTTTTATTTG AAAGGAATTG ATTGTTATGG AAAAAGGAAA TCAAGGTATT 
AAATGGTCTA GTTTAATAAT GGGTGTATTA TTATTAATGT TGGCASTCGT TATTTTTACA 
TTTCCAATTG AAAATTTTTA TGCTATTACC TGGTTGATTG GACTGTTTGT ATTAATTAAC 
GGTGTGATTC AAATCGTTTA CCGTAGAAAA GCAAAAGCTT TAGTAGGTGG TAACCAAAAT 
TGGATTCTGT TTATGGGGAT TGTAGATATT CTATTTGGTC TATTAGTTAT TTTTAATGTT 
GGCGCAAGTT CAGCATTCTT TATTTATATG TTTGCTTTTT GGTTTATTTT TAGTTCTATC 
TCrX^TTAT TTACGTTTTC GGGTAGTGGT AGCTTAAAAC TAATTTCAGT GATTTTTAAT 
TTATTAGGTA TTGTTTTCGG TGTCATTTTA TTATTTAATC CATTAATGGG TATCGTCTTT 
ATTTCGACGA TGATTGCTAT TGCATTTGTA TTCGTAGGTG TCATTTATGT TGTAGATGCA 
CTTGCTTAAG TAAAATGAAG CGGTTCAAAA GAAGGGTGTG ACATGAAGTT TGTGTCATAT 
CCTTTTTGTT GTGTTTATGA AGCATAAAAA AGGGGCGCTA CCTACAATAA GTAAGATACG 
CCCATATTTT TATATTTTAC TATTATTGTT TTTCAATACX3 ATTAATAGTT ACATTTAGTC 
CAAAATATTT TTCTAAAAAA TGTTTATAGT TATCTTTAGT GACATCAAAT TTTTCTGAGC 
TACCATTCCT TGTTAAAGTT AAATGATTTT CAGACATTGT AGCACGGCCA AATGATTGTG 
GCATTGTAAT TAATAAATGC TGTACAAATA TTGAATCTGG ATGCGTTTGA TTATATTCGA 
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AATGATCATT TTCGAATTTT TGAACATAGA AAATATCCTT GTCTTCGTTG TTAAAAATAG 3720 

CGCGGAATGT ACCACTGATA TCAGTAATTG GTTGTGTATG CTCAGATGAA GTAATAGGAA 3780 

TGGCATGTAG AGGTAAGTCT CCAAAGCCAA CATCAGTTAC ATAGAATACA TCATTTATAG 3840 

AAACAACAAG TGAAGCATGT GAACCGTTCA GACTACGACC GCCACCGGGw GTGTGAATAG* 3900 

TAGCTGACAT TAATTCAGGA TTAAATCCTT TrTGTTGTAA ATAGGCTTTG AAAAATGTAT 3960 

TTAATTCATA ACAAAAACCA CCACGTTTAT CATGAACAAT TTTATTAAAA AGTGCATCGA 4020 

TATTTATAGA TATCGGCTTA CTATTTTGAA CATCAATATT TTCAAAAGGT ACAGTTAACA 4080 

TAAAACGTGT TGCATAATAA TTTAATGCTT CAATACTCGG TCGATTATAA CGAGATGAAT 4140 

CAATTTGTAA ATAATTCTCT AACTTCGCAA TATTCATAAG CATAGCX5CCT CCTGTATTAA 4200 

AGATTATAAT TAAATTTTAA ACAGAAATAC TGAAATTTTA AATTCGAAAG CATTGAATTT 4260 

TGGATAAATA CAITTTAAAT AGAAAAATAC GCTCTCAAAA TGAAGTCATC TCTAAAAGAA 4320 

ACGATTTAAA GATGACTACT GAGAGCGTAg CATAATGGAA GAAGTGTGCA GGGTGTCTAA 4380 

AAATGCAACA ATACAAAGGT AGTTGCAAGA CAAGTTGCCT TATCTAGACC ATTTGTGTTC 4440 

25 TATQ::GACCA AACTTCCAAA TTAAACTTGA AATAAGCCAA GTAATTAAAA ATAATGCAAC 4500 

TAAAATATAG CCTAAATAAT CAAATTCGAT CGAACCAATG AATGCCCAAA ACGCACCATG 4560 

TAAATCTAAC TTATCAGCAA GAATTTGTAG CAATTCAATC ATCCCAATCA CTAATGCTGC 4620 

CATGACTGAT ATCGCAGTAA TCGTTATATT GTAATAGATT TTGCGAATAG GATTGAAGAA 4680 

TGCCCAATTA TAGGCATACT TCATTACAAC ACCATCTAAT GTATCCAATA AACTCATACC 4740 

TGATGCGAAT AAAATTGGTA AAGATAAGAT TCCGATAAAT GAAATGGCTT GTTGTGATGC 4 800 

GCCTGAAGAA AGAGCGAGTA ACGCAATTTC ACTAGCTGTA TCAAAACCAA GTCCAAATAA 4860 

-AAAGCCAAGT GGCAATACGT GCCAACTACG CGTGATTAAT TTGAAATAAG GTCCTACAAA 4 920 

TCGAGAAACC AATCCTCTAG ATTCAAGTAA TGCATCGACT TCAGCTTCTT CAATGTGTTC 4 980 

ACGACGTAAT TTAGCGAACA AGTTAATTAA AGAGATTAAA ATAATTAGAT TCAACACACC 5040 

GATAAGCACT AAAAAGAAAC CTGAAACTAG TGTACCAATC GTTCCACCAA TATCTTGGAA 5100 

ATGCGGTAAT TCATCTTTAG CCCATTTTAC AGATACCCCT AAAAAAACAG CCATTAAAAA 5160 
TACGACAGAT GAATGTCCAA 'TTGAAAAATA GAAACCCACA CCAGATGGAT CTTTGCGTTG * 5220 
CTGTAATAAT TTGCGaACCXS TATTATCTAT TGCAGCAATG TGATCTGCAT CAAATGCATG " 5280 

SO ACGCAAACCT AATGTATATG CAAGAATCCC CaTACCAAAT AAGATATGAT GGTCTTTTCC 5340 

AGCAATCCAT AAAAAACTAA ACCCAATAAC GTGTAACAAA ATGACAATAG CTATGTATGG 5400 
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ATATTTAATC ATACTGTATG TTCAATGGGC ACTCTAGTAA TAAGTGTTCA TATAACAAAA 
ATGTTATGCC AAATTATTTG TTATATAAAA ATATACATGT AACCACAAAA GATTTTTTGC 
GATATATATA ATTTGATAAA TTAACCAACA ACAATGTAAG ATGTCACTTT GCTTAACTTG 
GCATCCTTTT TATGATTTTC AAATTCAAAA AAATGAGCAA AATGAATCTC TTTAcCAGTT 
TTTAATATTT CaATACCATG CATGGAACCT AAGCACCCAT GTGTGATGCT GGAATGGATA 
TTGAGACTAG CAACCTGATT GTAATGATTA GATAGTTCTT GAATTAATAT TTGAGGTCCG 
TATATGTCAA AGCGGCCAGG GACAGACCAA ATAAATTCTG TTGTAACCAG TGAACGTAAT 
AATTCAATAT CTAATGCTGC TGTAACAACT ATAAAATCTA TCATTTGTTG ACGTTTAGGC 

GCATGATTGC ATGACACATC TCCTGTTAAC TTAAAAGGTA AT6ATGACTG AACTTCOGTT 

. • ♦.. . . 

TTAAAATGTA GTTGGTGCTG AAATAAAGCT TGTTC 
(2) INFORMATION FOR SEQ ID NO: 273: 

(i) SEQUENCE CHARACTERISTICS: • 

(A) LENGTH: 1039 base pairs 

(B) TYPE: nucleic, acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 273: 
TTTTGAACAG CCATATTTAT TCACCCTCAA CATCATTATA ATGGTATTAG TCGCATTACC 
TTCACTTGTT TTAGCTATAT ATGATTATAT GAGTTTTAGA ATTTCTTCTG CTATTTTACA 
ATTTCTAGGG GCTATCTCTT GGTTCTTTTT ATCATTGATA TTATCGCTCA CACAATTTAC 
ACCTTTTACA TTAGCGTCAT TTATAACTTC AATTATTTTG TTCACAAGCA CAATTATCAC 
ATT^CCATT GGTGGTAAGT CTGTTGAAAA GAATGATTCC CCTTAAATTC CAAATGAAAA 
AAAGGTTCTG AAGGCCGCTA TAAAACACAG TTTTTCAGAA CCTCTATACT TCTATTCAAT 
GATATATGGT TTGCAATTTT CTACCTTTAA ATCCACAGCT TCTGCCCTTG AAACTTTGTT 
AAAATAAACC ATCAAACAAC GAATGACAAC TTGATGTGCA ACAATGACAA TATCATCTTT 
TTGTGTATCT TCATTGACAA CATGATTCAT AAAATGTTCT ACGCGTTGAT ATACATCTTC 
ATAACTTTCT CCTTCAGGCG CTTTITGTGA AAAACTATGA CGAAAGTCTT TAAAGTTTGG 
ATCATTGAAA TATTTTTCAT ATTTCGGATT CGCACTGATT TCATCTTTAT ATTCACCCTC 
AAATACGCCA AGTGAACGTT CTCTTAATAG AGGGGTAGTC GTTGATGCAA TGTCATATGG 
AAAAATATGT TCAAACGTTT GCTGTGTTCT TAATAAGTCT GAAACATATA CATGTTTAAT 
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CGGCACATCT AATTGTCCAC AAAAATAAGA TCGAAAATGT TTATTATCAT AATTCGATTT 
TGATTCGCCA TGTCTAACTA AATAAATCGT CATAATATTA CTCCTTACCT TATGTATTTC 
ATATCTACCA TAACACTTTG ACTACTAATT CGATATCAAT CTTAATATTC TATTCTAAAA 
AAAC3AATTAA TTCATATnT 
(2) INFORMATION" FOR SEQ ID NO: 274: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1496 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 274: 
GAGAGAATnT GCAATTAGTT ATTCAATTAG TTGATTTAAG ACATGATCCA ACACAAGATG 
ATATCTTAAT GTACAATTAT TTGAAACATT TTGATATTCC TAdTTAGTr ATATGCACTA" 
ArGAaGACAA AATTCCaAAA GGTAAGGTyC AAAAGCATAT TAAAAATATT AAGACACAAT 
TAGAXATGGA CCCAGACGAT ACAATTGTAA GTTATTCATC AATTCAAAAT AATAraaCAAC 
AACAAATATG GAATTTAATT GAACCGTATA TTTCATAGTT TTTGTACGTC AAAACTTATA 
CAAAAATTTT AAAAATAATG TAAGCACGAA ACTTTTAATT AGTACACAAT TGATAACATT 
TTTCAACGTT CATCATTTTG TCAAAAACTC AAAAGTAAAT TAGAAAGATT ATAATTTATT 
TAAGCATCGT ACTTAATTGG ATTTTAAATT ATGTTATAAT ATTTGTATTG TTAGTATATA 
TGGGGGCTTT TCAAATGCAT TTTATTGCAA TTAGTATAAA TCATCGCACA GCTGATGTgC 
ACTAAGAGAG CAAGTTACTT TTAGAGATGA TGCCTTACGA ATTGCCCATG AAGATTTATA 
TGAA&ITAAA TCTAyTTTAG AAAATGgTCA TATTaTCAAC ATGTAATCGA ACTGAAGTAT 
ATGCTGTTGT TGATCAAATT CACACAGGTC GTTACTATAT TCAACGATTT CTAGCTCGTG 
CATTTGGATT TGAAGTAGAT GATATTAAAG CAATGTCAGA AGTAAAAGTG GGGGACGAAG 
CaGTAGAACA TTTATTGCGT GTCACTTCTG GTTTAGATTC AATCGTACTT GGAGAAACTC 
AAATTTTAGG TCAAATAAGA QATGCATTTT TCTTAGCGCA AAGCACAGGT ACGACAGGrA 
CAATTTTTAA TCATCTATTT AAACAGGCAA TTACTTTTGC AAAAAGAGCA CATAATGAAA 
CAGATATAGC TGATAATGCT GTAAGTGTGT CTTATGCTGC GGTCGAGTTG GCGAAAAAAG 
TATTTGGCAA ATTGAAAAGT AAGCAAGCTA TCATTATTGG TGCAGGGGAA ATGAGTGAAT 
TATCACTATT AAATCTTCTT GGTTCTGGAA TTACTGaTAT TACAGTAGTA AATAGAACAA 
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TACCAAATTT ACTTGAAAGT GCAGATATTG TGATTAGTTC AACGAGTGCA CAATCTTATA' 1260 

TCAXTACAAA TGAAATGATA GAAAGAATTG CAGAAAATAG AAAGCAAGAT TCACTAGTAT 1320 

TGATTGATAT TGCAGTTCCT CGAGATATTG AACCTGGTAT TAGTGCCATC ACAAACATCT 1380 

TTAATTATGA TGTTGATGAC TTAAAAGGTT TAGTTGATGC AAACTTACGT GAGCGACAAT 1440 

TAGCGGCTGC AACAATTTCG GAACAAATTC CTACAGAAAT ACATGCACAC AATGAG 1496 



70 

(2) INFORMATION FOR SEQ ID NO: 275; 
{i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4826 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SBQ ID NO: 275: 





CTTGATTTTT 


TCCCtTTAGT 


ATTTTCCaTt 


TGanTGTCGC 


AGCTTCTAAA 


TCCTGCTTTG 


60 




GTTCTCTAGT 


GAACTTCATA 


ATTAAAGCAG 


ctacaacgaa'.tgatacaagt GCAGCAAGGA. 


120 


2S 


AGACACCGAG 


TAACATGTGC 


AAGAATTCAC 


CTCTAGGTGC 


ATTTAAACAG 


TAAACTATAA 


IBO 




ATGAACCTGG 


TGACGCGGGA 


CTTTTAAATC 


CAAATCCTGT 


TGCTTGATAA 


GTTGCAACAC 


240 




CAGTCATTCC 


ACCTAAAATA 


ACAGCGATAA 


ATAATAAAGG 


ACGCATTAAT 


ACATATGGGA 


300 


30 


AATAAATTTC 


ATGAATACCA 


CCTAAGAAGT 


GGATAATTCC 


AGCACCATAT 


GACGTTGCTT 


360 




TTGCAGTGCC 


TTTTCCAAAA 


ATCATATAAG 


CAAGTAAGAT 


ACCTAAACCT 


GGTCCAGGGT 


420 




TAGATTCAAT 


TGTGTATAAA 


ATTGATTGAC 


CAGCTTTTGC 


AGCTTGATCT 


GCACCAAGCG 


480 


3S 


GTGTGAATAC 


ACCATGGTTA 


ATCGCATTGT 


TTAAAAATAC 


AATTTTTGCA 


GGCTCTACTA 


540 




AAATACTTAC 

* 


AAGTGGAAGT 


AGGTGTGCAT 


GTACTAATGC 


TTCAACTGCC 


ACTGATAAAA 


600 


40 


TATGCATAAT 


AAATTTCATA 


AGTGGTGCTA 


AAATTTTAAA 


TCCTGCAATC 


GTCATGATAA 


660 


ATCCTAAAAT 


ACCAGCAGAA 


AAGTTATTAA 


ATAACATTTC 


AAAACCTTGC 


GGCGTTCTAG 


720 




GTTGAATCAA 


TTGGTCGGTC 


TTCTTCATTA 


ACCAACCAAC 


AAGTGGACCC 


ATAATCATTG 


780 


45 


CACCAAGTAA 


CATTGGTGTA 


TCAGGTAATG 


CAACGATGAC 


CCCCATAGTT 


GCTGTTGCTG 


840 




CGATGATACC 


ACCACGTAAA 


TCATAAATTA 


AAC6ACCACC 


ACTAAAT6CG 


ATCAATAATG 


900 




GGATTAAATA 


AGTAATCATT 


GGTCCTGCTA 


AAGTAGCTAA 


ATCTTTGTTA 


GGTAACCATC 


960 


50 


CATTATCTAT 


AAAAATGGCC 


GCGATAAAAC 


CCCAAGCGAT 

* 


GAAAGCGCCA 


ATGTTTGGCA 


1020 




TGATCATACT 


ACTTAAGAAT 


GATCCAAATG 


CTTGAACACG 


ACGACCAATT 


CCTTTTTTCT 


1080 
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GAGAGGTTAC TTGTTACTCA ATATAAACAA AAATCAACTT TGTCAAAATA AATGTGACAA 
AATTAAATAA AGTGTCATCA ATGTGACAGT ATAGATATTT TGAAAAAGTA AAACAAAAAA 
ATTGTTTTAG GATTTTTAAA ATTTTATTGT GAAAATATTT GCAAAACAAA ACAACACCGT 
gTACAATAAT GATTAATGGA AAGGGGGAAA GTTCGGCAGT ACAGTTAAAG CGCCTGTGCA 
AATAAATATT TGTATTTGAA GATTAAAGGT TAATATATGA GTGGCCTTTA TAGAGTGCAA 
TATATGTATT TGTAGACGAG GAGGATAGTG ATCGAATAGA TCGGCGGATG CTATCCCGGA 
TGTGGCTCAT TCGTTAGCTT ATTAAGTAAA ACATTAGGGT GACTTAATGG ACAAAGTTAA 
TAAGATGGCC AGAAATTGAA TATAAAAAAT ATTAATATGG AAAGTACAGT GTGAGCAATT 
TGTATAGTTG TAAAAATAAC TATGCTTAAT TTGTTATGGA TGAATGCGAT GATAGCATGT 
TCCTATTTAT ATTATGAAAG CAGATTGTCA ATCTAAATTA TOGGCAATAA ATCATAATTT 
ACGCGTACTA TTCCAATATG GAGGAAAATG TCGTTATGTG TGGAATTGTT GGTTATATTG 
GCTATGaTAA TGCCAAAGAA TTATTATTAA AAGGTTTAGA AAAATTAGAA TACAGAGGTT 
ATGACTCTGC AGGTATCGCA. GTAGTAAATG ATGATAATAC AACTGTATTT AAAGAAAAAG 
GTCGTATTGC AGAATTACGT AAAGTTGCTG ATAGTAGCGA TTTTGATGGA CCTGTTGGAA 
TCGGTCACAC ACGTTGGGCA ACACACGGTG TACCGAATCA TGAAAACTCT CATCCACATC 
AATCATCAAA TGGCCGTTTT ACTCTAGTTC ATAACGGTGT TATTGAAAAC TATGAAGAGT 
TAAAAGGTGA ATACTTACAA GGTGTATCAT TCATTTCAGA AACAGATACA GAAGTTATCG 
TTCAATTAGT TGAATACTTT TCAAATCAAG GACTTTCAAC TGAAGAAGCA TTTACAAAAG 
TTGTGTCATT ATTACATGGT TCATATGCAT TAGGTTTATT AGATGCTGAA GACAAAGACA 
CAATCTATGT TGCTAAAAAT AAATCACCAT TATTATTAGG TGTTGGTGAA GGTTTCAATG 
TTAXeGCATC AGACGCACTT GCAATGTTAC AAGTGACAAG CGAATATAAA GAAATCCATG 
ACCATGAAAT CGTTATTGTT AAAAAAGATG AAGTTATTAT TAAAGATGCA GATGGAAACG 
TTGTAGAACG TGATTCATAT ATTGCTGAAA TTGATGCATC AGATGCTGAA AAAGGTGTTT 
ATGCACACTA CATGTTAAAA GAAATTCATG AACAACCAGC AGTAATGCGT CGTATTATTC 
AAGAATATCA AGATGCAGAA GGTAACTTGA AAATTGATCA AGACATCATC AATGATGTTA 
AAGAAGCAGA CCGCATTTAC GTTATTGCAG CAGGTACAAG CTACCATGCA GGTTTAGTAG 
GTAAAGAATT TTTAGAAAAA TGGGCTGGCG TACCAACTGA AGTACACGTT GCATCAGAGT 
TTGTCTACAA CATGCCATTA TTATCTGAAA AACCATTGTT CGTTTATATT TCTCAATCAG 
GTGAAACTGC AGATAGCCGC GCCGTATTAG TTGAAACTAA TAAATTAGGT CATAAATCAT 
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TACACGCGGG TCCTGAAATC GCAGTTGCAT CTACAAAAGC ATATACTGCA* CAAATTGCAG 
TATTATCAAT CTTGTCTCAA ATCGTTGCAA AAGAGCaTGG TCGTGAAGCA GATATTGATT 
TATTGAGAGA ATTAGCAAAA GTAACAACAG CAATAGAAGC AATTGTTGAC GATGCACCAA 
TTATGGAACA AATTGCTACA GATTTCTTAG - AAACAACACG CAATGCATTC TTTATCGGAC 
GTACTATTGA CTATAACGTA AGTTTAGAAG GTGCGTTAAA ACTTAAAGAA ATTTCTTACA 
TTCaAGCAGA AGGTTTTGCT GGTGGAGAAC TTAAACATGG. TACAATTGCC TTAATCGAAG 
AAGGTACACC AGTTGTAGGT TTAGCAACAC AAGAGAAAGT TAATTTATCA ATTCGTGGTA. 
ACGTTAAAGA GGTAGTAGCA CGTGGTGCAC ATCCATGTAT TATTTCTATG GAGGGTCTTG 
AAAAAGAAGG CGACACTTAT GTCATTCCTC ATGTACATGA ATTGTTAACG CCATTAGTAT 
CAGTGGTTGC ATTACAATTA ATTTCATACT ATGCAGCATT ACACAGAGAT TTAGATGTTG 
ATAAACCACG TAACCTTGCT AAATCAGTTA CTGTGGAATA ATTCACTTTT TTAGAATCAA 
TCATGTATTA AAATTAAAGT ATATGGCAGC CTTTTAGATT AATCGACTAG AAGGGTQCTT 
TTTTAGGTCG ACTTaGCTTT TACTTCATCT TAATTTGGCA GAAATGCX^Ta AAAATGAAGT 
GTTTTATTTA TTTAAATAGT CTGACAATTA AGGGTCfTTAT GTTAATATGA TTTTATGAGA 
AGTATGGAGT AGCAATAAAG GGGTGACCTC GCATGTTAAT TCAATTAGAT CAAATTGGGC 
GAATGAAGCA AGGAAAAACA ATTTTAAAAA AGATTTCTTG GCAAATTGCT AAAGGTGATA 
AATGGATATT ATATGGGTTG AATGGTGCTG GCAAGACAAC ACTTCTAAAT ATTTTAAATG 
CGTATGAGCC TGCAACATCT GGAACTGTTA ACCTTTTCGG TAAAATGCCA GGCAAGGTAG 
GGTATTCTGC AGAGACTGTA CGACAACATA TAGGTTTTGT ATCTCATAGT TTACTGGAAA 
AGTTTCAAGA GGGTGAAAGA GTAATCGATG TGGTGATAAG CGGTGCCTTT AAATCAATTG 
GTGWTATCA AGATATTGAT GATGAGATAC GTAATGAAGC ACATCAATTA CTTAAATTAG 
TTGGAATGTC TGCTAAAGCG CAACAATATA TrGGTTATTT ATCTACCGGT GAAAAACAAC 
GAGTGATGAT TGCACGAGCT TTAATGGGGC AACCCCAGGT TTTAATTTTA GATGAGCCAG 
CAGCTGGTTT AGACTTTATT GCACGAGAAT CGTTGTTAAG TATACTTGAC TCATTGTCAG 
ATTCATATCC AACGCTTCCG ATGATTTATG TGACGCACTT TATTGAAGAA ATAACTGCTA 
ACTTTTCCAA AATTTTACTG CTAAAAGATG GCCAAAGTAT TCAACAAGGC GCTGTAGAAG 
ACATATTAAC 'TTCTGAAAAC ATGTCACGAT TTTTCCAGAA AAATGTAGCA GTTCAAAGAT 
GGAATAATCG ATTTTCTATG GCAATGTTAG AGTAAATATT TTGCAAATAA TAAGTAATAA 
TGACAAAATT TAATTAAGAT AAAATGGACA GTGGAGGGCA ATATGGATAA CGTAAAAGCA 
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AAAGATGTCA TTAATCAATT GAGAGAGAAA GGATATAAAG TATTTTTGGC AACAGGACGT * 4800 
TCGCATTCTG AAAATACATC AACTTG 482S 
^ (2) INFORMATION FOR SEQ ID NO: 276: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4846 base pairs 

(B) TYPE: nucleic acid 
10 (C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



75 



30 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 276: 

GAATAAAAAG TAAAATTACT CGCCTTTGTT ACCTTTTACT TTATCAATaA AATCAGTTGC . 60 

TTTTTCTTTT GCATTTTCAA CGAATTCTTT CGCTTTACCA GAAGCTTTAT CTTCTTTACC 120 

20 TTOGTTTTCT AAATTTTTAT TATCAGTAAC ATTACCTACT GTTTCTTTAA CATTACCTTT 180 

TGCTTGTTCA AATTTACTTT CGTCTGCCAT AATAAATGCC TCCTCGGAAT AATTAAATGT 240 

. TATATATAAT ACTTACCCAC TGAAAAATTA TCTAAACATT TTACTTAAAT AATTTTTGAT 300 

25 ATTGATTTGA CGTCATTTTA TAACTAGCGA AATAGATTCA TCATTAACTT GAGGGAGTGG 360 

GACTGAAATA ATAAAGAATC ACTAATGATT TATGATGTAT TAGTCACTAG CCATGTGAAA 420 

TTAAAAATAA GAATAAATGA GTAGCACGCA TGCATATAGG ATTTTACTTT ATCCGTAATA 480 

GCATCTCATT CCTAAATATC ATATAAATAC CTGTTTAAAT TAAAAAGCCC AGCAACATCA 540 

CGTTACTGAG CCATTAATAT GATTTATTTA GCAGGAATAA CTGCACCATT GTATTTTTCA 600 

TTAATGAAGT CTTGAATATC TTTAGATTGT AATACTTCAA TTAATGCTTT GATTTTCTTA 660 

TCATCTTGAT GTCCTTCTTT AACAGCAATT AAGTTTGCAT AAGGATTATC TTTCGCACTT 720 

TCTACAGCAA TAGAATCTTT TTTAGGATTT AGTTTTTGTT CGATTGCAAA GTTCGAATTA ' 780 

ATGATAACAG CATCAGCGTC TTCATTTTGA TAAATTTTAG GTAAGAATTC TGCTGATTGT 840 

TTATTATTAA ACTTAATATC TTTTTTATTC TCTGTAATAT CACTAAACTT AGCATCTTCA 900 

ATTTTTACGC CITTTTTGAT TTTAATTAAA CCTGCATCAA CGAAGAATTT TAAGAAACGT 960 

45 CCTTGTTCAG CTGGATTATT AGACACATAG ACTGTTGCAC CTTTTGGTAA TTCTTTTAAA 1020 

CTTTTATACT TTTTAGAGTA TACAGCCATA GGTTCTAAGT GAACATCACC GGCACTTACG 1080 

ATTTTGTAAC CTTTATCCTT TTTCTCTGTG TTTAAATATG GTGTATGTTG GAAATAGTTT ' 1140 

SO GCGTCAATTT CACCTTTGTC TAGTAATTTA TTAGGTGTAG TGTAATCGTT AATTGTTTTA 1200 

ATATCTAGTT CATAACCTTT TTTCTCTAAT AATGGTTTTG CTTTTTCTAA AATTTCAGCA 1260 
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TTACCGCAAG CTGCTAATAC AACTGCAAAT GTTAATACTA AAATAAGACC AAATAATTTT 
TTCATAAAAT GAAACCCCCA ATTTATCGTT TATCAAGTTT ATTTGTAAGC CAATCCCCAA 
TGAATTGGAT TATAAATACA ATAATTAAAA TAAAAACTGT TGATACTAAA ATGACATCAT 
TTTGATTTCG AGTGAAACCT GTTAAGTATG CTAAATTTCC TAAACCACCG GCACCAATTA 
CACCTGCAAC TGCTGTTGAA CCAACTAAAG CGATTGCTGT AACTGTAATG CCAGACACTA 
GCGCTGGCAT AGCTTCAGGT AAAAGGACTT TACGAATTAC TGTCCAAGTA TTAGCGCCCA 
TTGACCAAGC CGCTTCGATG ACACCTTTAT CAATTTCTTT. AAAAGCAATT TCTACGAGCC 
TTGCATAAAA CGGTGctGCG CCAATGATCA AGGCTGGTAA CGCACCTGTC GGACCACTTA 
TCGTTCCAAG TATCAAACTT GTAAATGGAA TTAATAATAA AATTAAAATA ATAAATGGTA 
TCGCTCTAAA TAAGTTAACA ATGAAAGAAA CGATAGAATA AAATAACCTT GCACCGATAG 
ACTTACCTTT AGCAGACAAG AATAATAACA CACCTAAAAT AAGACCAAGT ATAAATGCAA 
ATATAGTTGA GACGACTGTC ATGTATAGTG TTTCGACTAT TGCAGTCCAA ACTTCTGGCC 
ACTGAATATT AGGCATTGTA ATCATTTCAT .TTATAATTTC ACTAAATGAT TTACCCATGT 

^ ' * ■ 

CTTAACACCT CCATTTTAAC TTGTCGCTCA ATTAACTCTT TTTCGAATTT TCCGAAATCT 
ACACTTGAAA TATATGGAAT ATGCAGAACT AAAAAGCCGA CTGTTCCATT TTTTGTATTT 
TTAATATTTG CTTCTAAAAT ATTAATTTTA ATATCATAGG CAGTTGATAG ACTCGATACA 
ATAGGCTCGG TTGTTGTTGA ACCAGCGAAA ACTAATCTAA CGATATATGC ATCTTTTTCT 
AATGGCTCTA ATTCTGTTAA AGATGTTTCG AAATCATCAT TTAAATCGTC TTTCACAAAT 
CGTTTTGTCA CAGTGTGTTG CGGATTTTCA AAAACCTGTG TCACCGGTCC TTGTTCTATC 
ACTTTACCAC TTTCCATAAC TGCAACTTCA TCACAAATAC GACGAATGAC ATGCATTTCA 
TGCG'BUITTA GTACAATTGT TAAATTTTGT TGTTCTCTAA TTTTTAGTAG TAGATCTAAA 

atttCatctg ttgtttgcgg atcaagtgca cttgttgcct catcacaaag caagaccgtt 
ggatcattag taacgctcgt gcaatcccaa cacgttgctt ttgtccacct gataactctg 

ATGGATAAGC CTTTTCTCTA CCTTTTAAAC CGACGAGTTC GACAAGTTCT AATGCTTTTT 
GCTTAGCTCT CCTTCTAGGG ACACCTGCAA TTTCAAGCGG AAACATAATA TTTTTTAACA 
CAGTCCTTGA CCATAACAAA TTAAAATGTT GGAAGATCAT ACTTACTTTT TGTCTTTTTG 
CTCTTAATCC ATTTTTGGAC AATTGACCTA* TATGGTCTCC ATCTATAATA ACTTCACCTG 
ATGTAGGCGC TTCTAAATGA TTAAACATTC GAATCAAAGT ACTTTTTCCT GCTCCAGAAA 
AACCAATGAC GCCATAAATC GATCCTGCTC GAATCGATAA ATTAACGTGA TCTACAGCAA 
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TTCCTCCCTG TGTTGCTTAA TAAAATAAAA AATGCTTTCT CAATATCGAT AGAAAAATTG 3180 

AGAAAGCAAT AGTAGTATTG TTTCTCTCAT CTTCAAAAGT TAAAACTTTA TGTGAATTGG 3240 

CACCATTTCT ATATAAGACG GTTGCCGGGC TTCGTAGGGC ACATCCCTCC ACCACTCTCG 3300 

ATAAGAGTTT ACGCATCATT TAATTTGTAT TAATCCTAAC ACCTTAGTAA AATTTCX5TCA 3360 

ATAACTATTT TAAATTTTCT AACAAATCAG TCACCGATTT AAATGCATAA ATTCGTTTTA 3420 

CTTCTTTATC TTTATTCATC AACAATAAAA TCGGCGTAGA CATGATTTGC ATATCTTTAC 3480 

AAAACTGAGG ATAAAAGTTT AAATCTATTT TCAATAATGG TAACTGCAAT ATTTCATTAG 3540 

CAATGTCTAA CATTCTTTCT GaAACCTTAC AAGTACCACA CGTTGGTGTA TAACCAAAGA 3600 

TTAAATGTTT G TCTTCCTCA TAAAATGTAG TTACATCTTT GATGTCTAAT GAATTATTCA 36.60 

TTTACTAAAA CTAACCTTTC ATTATTTATA TTCGGTAAAA GAGGTGTTTC TTTCTTACAA 3720 

GTAAAGCCAT GTTTTGAAAG TACATGCGCC AAATATTGTT TGGGGCAATT CGCAACTTGA 3780 

CAGTAAGTTT TATCAATAAA TATATGTTCA CTTTCACTCA AATAACGTTT AAACCAATTT 3840 

CTAATTCGAT CTCCTTCGTC ATCAGAATCG GCTAATACAA AAACTTGTTT ATCATACAGT 3900 

2$ GATTCTATCA TATCATCAAG CTTATCTATA CTCATTGTTC CATGAGTACA AATAATATTG 3960 

ACTGGTTCTG CAATAACCTG TTGCACCCTT TTTTTATCAG ATTTTCCTTC AACAATTATC 4020 

ACTTTATTTA CAATAGCCAT CATCATCACC CTTTAAAATC AATAAACATC TGTCACTGTA 4080 

30 TCATTTCACA AAATTGGTAT GAATAAAACA TAAATCACAA AAAATTTAAA CTAGCTTAAT 4140 

ATAATAATTA CAAACTCAAT GTTTGACTAG CTGGAACATT TAACATAAGC AGACAAAGGC 4200 

TAAGTCAAAA ATCAACATCC TAAAATCTAC AATGTTATAT TAACAATAGT TAACCAAAAG 4260 

AAAATACACC TATAACAAAC TTTTCAATTA TAGCGGGGCC CCAACACAGA AGCTGATGGT 4320 

AAGTCAGCTT ACAATAATGT GCAAGTTGGC GGGGCCCCAA CATAAAGAAA TACTTTTTCT 4380 

TTAGAAATTA GTATTTCTTA TGCATGAGTT TTACTCATGT ATTCCTATTT TTAAATACAC 4440 

ATTAGCTGTG GCTTATGAAA ACAGGCTGGG ACATAAATCA ATGTTCTATQ CTCTACOAAg 4500 

TTATATTGGC AGTAGTTGAC TGAACGAAAA TGCGCTTGTA ACAAGCTTTT TTCAATTCTA 4560 

GTCAGGGGCC CCAACACAGA GAATTTCGAA AAGAAATTCT ACAGGCAATG CAAGTTGGGG 4620 

ATGGGCCCCA ACAAAGAGAA ATTGGATTCC CAATTTCTAC AGACAATGCA AGTTGGGGTG 4680 

GGACGACGAA ATAAATTTTG CGAAAATATC ATTTATGTCC CACTCCCTAG ATTGATCTAT 474 0 

SO AGATACTACA CTTATTAAAG TAATATATTT TTATGATTCT CTTAGCTGCA ATCCCATGAA 4800 

XACATGTAAT CATCAAACTT CATAGCCTCA AGGTCAGTAG ATTTCA 4846 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1843 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 277: 
AACAAAGACA CAATCGAACA TGAACCATCA GTAAAAGCTG AAGATATATC AAAAAAGGAG 
GATACACCAA AAGAAGTAGC TGATGTTGCT GAAGTTCAGC CGAAATCGTC AGTCACTCAT 
AACGCAGAGA CACCTAAGGT TAGAAAAGCT CGTTCTGTTG ATGAAGGCTC TTTTGATATT 
ACAAGAGATT CTAAAAATGT AGTTGAATCT ACCCCAATTA CAATTCAAGG TAAAGAACAT 
TTTGAAGGTT ACG6AAGTGT TGATATACAA AAAAAACCAA CAGATTTAGG GGTATCAGAG 
GTAACCAGGT TTAATGTTGG TAATGAAAGT AATGGTTTGA TAGGAGCTTT ACAATTAAAA 
AATAAAATAG ATTTTAGTAA GGATTTCAAT TTTAAAGTTA GAGTGGCAAA TAACCATCAA 
TCAAATACCA CAGGTGCTGA TGGTTGGGGG TTCTTATTTA GTAAAGGAAA TGCAGAAGAA 
TATTTAACTA ATGGTGGAAT CCTTGGGGAT AAAGGTCTGG TAAATTCAGG CGGATTTAAA 
ATTGATACTG GATACATTTA TACAAGTTCC ATGGACAAAA CTGAAAAGCA AGCTGGACAA 
GGTTATAGAG GATACGGAGC TTTTGTGAAA AATGACAGTT CTGGTAATTC ACAAATGGTT 
GGAGAAAATA TTGATAAATC AAAAACTAAT TTTTTAAACT ATGCGGACAA TTCAACTAAT 
ACATCAGATG GAAAGTTTCA TGGGCAACGT TTAAATGATG TCATCTTAAC TTATGTTGCT 
TCAACTGGTA AAATGAGAGC AGAATATGCT GGTAAAACTT GGGAGACTTC AATAACAGAT 
TTAGGTTTAT CTAAAAATCA GGCATATAAT TTCTTAATTA CATCTAGTCA AAGATGGGGC 

ctt;Atcaag ggataaatgc aaatggctgg atgagaactg acttgaaagg ttcagagttt 
acttttacac cagaagcgcc aaaaacaata acagaattag aaaaaaaagt tgaagagatt 
ccattcaaga aagaacgtaa atttaatccg gatttagcac cagggacaga aaaagtaaca 

AGAGAAGGAC AAAAAGGTGA GAAGACAATA ACGACrCCAA CACTAAAAAA TCCATTAACT 
GGAGwAATTA TTAGTAAAGG TGAAyCgAAA GAAGAAATCA CAAAAGATCC GATTAATGAA 
TTAACAGAAT ACGGACCAGA AACGATAACA CCAGGTCATC GAGACGAATT TGATCCGAAG 
TTACCAACAG GAGAGAAAGA GGAAGTTCCA GGTAAACCAG GAATTAAGAA TCCAGAAACA 
GGAGAyGTAG TTAGACCACC GGTCGATAGC GTAACAAAAT ATGGACCTGT AAAAGGAGAC 
TCGATTGTAG AAAAAGAAGA rATTCCATTC rAGAAAGAAC GTAAATTTAA TCCTGATTTA 
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CCAACACTAA AAAATCCATT AACTGGAGAA ATTATTAGTA AAGGTGAATC GAAAGAAGAA 
ATCACAAAAG ATCCGATTAA TGAATTAACA GAATACGGAC CAGAAACGAT AACACCAGGT 
CATCGAGACG AATTTGATCC GAAGTTACCA ACAGGAGAGA AAGAGGAAGT TCCAGGTAAA 
CCAGGAATTa AGAATCCAGA AACAGGAGAT GTAGTTAGAC CACCGGTCGA TaGCGTAACA 
AAATATGGgA CCTGTaAAAG GAGACTCgAT TgTaGGAAAA AGarGAATTc CaTTCaGGAA 
AGAcGTaATT TaTCCTGTTT AGCACCCGGG GCAGAAAAGT TAC 
(2) INFORMATION FOR SEQ ID NO: 278': 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 8536 base pairs 

(B) TYPE: nucleic acid " . 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQXJBNCB DESCRIPTION: SEQ ID NO: 278: 



TAAACAGCGC 


GTGTACTTGT 


GATTCCCCCT TCTTCTATTT 


TACCCACCCG 


GGAAATAATA 


CTTTTCGCGA 


TTCCTTACTT 


GaACAAGCAA TATTTTATCa 


GCTGTTTCTT 


CAACTAAACA 


GACACATTTA 


ATCATCTTTG 


ACACCCCAAC 


TTTGTGAAAT 


CAATTTTTCA AATTATACTG 


TACAATTATG 


TTATCATATA 


TGAGTAGTTA 


TAGCGCAAAA 


CGTTAGCAAT 


TCAGCGCACC 


CAACTTTTCA 


TATAAACAGA 


AGATACTAGG 


GGGAATTATT 


ATTATGGCAA AACgTTCCAA 


ATCACAACGT 


TTATCAAGTT 


TACTAAATGT 


CGCAGGTTTC 


ATAGTCGACG 


GCTACAATGG 


CTATAAATAT 


CATGCTAAAA ATAAAAAATT 


AGTATATCTT 


TCATTAGGTT 


TAAGCACTGT 


AGGAACCGTG 


TTAGACTTTT 


ACATTTCAAT 


TAAGTCACCA 


CGTAAGTTCA AAAAAGCAGT 


GGCifeTTGTT 


* 

ACTTTAATAA 


CAAACGGTGC 


TAGATTATTT 


ACAAGCATTC 


GCAAAGTAAA 


ACATGAATAC 


TAATTCAGAA 


AAGGATTGGT 


CGAACATAGA 


ACATGAAGTT 


CATTCGACCA 


ATCCTTTTTC 


ATATACAAAA 


ATTCCTATTA 


CAACAATCAC 


GACTTTGATA 


GCCCCGCCAT 


AAAATTTAGG 


ATTCAATCCA 


ACTTTTCAGC 


TTGTGaAATG 


TAATAGGaU^T 


TCATTATATA 


TTTATATACG 


TAAGACnTA 


GTGAATATAT 


CTATAATTAT 


TTACTTGGTA AGCTGGTACC 


GTTCTGTAAG 


TTAAAATACC 


TGGTGCAGCT 


GAATAGTTCA 


TTTCTGAAAC 


TAAAATACTA 


CCATCGTTAT 


TTACACGTTC 


TACAAACATA 


ACATGACCAT 


AGTAACCTAC 


ATCTGTTTGA 


GCGATAGAAC 


CTACAGTAGG 


TCTATTGTCG 


ATAGTGTAAC 


CATCTGCTGC 


CGCTGCGTTA 


TCCCAGTTAT 


TAGCATTCCA CCAATAAGTA 


CTAATACCTT 


TACCAATTTC 


AGCACGACGA 
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GTATTGTAAC CTCTATTTGT CGTTGTTGCA GATCCTGAGT TCGTAGATGC aTTACCAGTT 
ACTTTCAATT TTTGACCCGG ATATATAAAG AAATTATTTA AGCCATTTAA GCTCATAATT 
TTTT6ATAAG TTGTACCATA TTTTGATGCA ATTAATGACA ATGAGTCACC TGCTTGTACT 
GTATAGTATG ATCCGCCACC TGAGTTCGTT GATGGACGGC TACTATTGCT CGCAGCGTTA 
CTTGAGCTAG CAGTACCTGA TACTTTTAAT TTTTGACCTG GATAAATAAA GAAATTATTT. 
AAACCAITAA GTCGCATAAT GTTTTGGTAA - GTTGTACCAT ATTTTGATGC GATTAATGAT 
AATGAGTCGC CTGCTTGTAC TGTGTAGTAT GATCCGCCAC CTGAGTTCGT TGATGGACGG 
CTACTATTAC TCGTAGAATT ACTTGAGCCA GATACTTTTA GTACTTGGTT TGGGAAAATT 
AGATTAGATG TTAAATTGTT TAATGACTTT AATTTAGCAA TCGAAATCCC ATACTTATTT 
GAAATTGCCC ACACTGATTC ACCCGGTTTT ACTGTGTGA6- TTGTAGCCGC ATTTGCTTGA 
GTTGCCGCAA CAGCGCTAAT CGCGCTTGTC CCAATAATAG CTGCAATTAC TTTTTTTTGC 
ACTTTAAAAT CCTCCTCTTG CTTAACTTTC CTAACATTCT TTTATCCGAA TTTATGAATA 
CTACATCATT ATACGATTTT ATTATGTATA ATAGGTTGAT GTTTGATGAC- ATTATGaTTA 
CAAAAAAATC ATATACTGTA TCATCAAATT TTATAATTAT- CCCTTAAAAT TATTACAACT 
TATTAGATTT TACAATATCT AAATTATTAC AATTTCATAA TATTTCACTA TAAAATGATT 
ACAATCCCTT TCTCTATTGG AAATAATTTT ATTCTCCAAC AATAACGCCC TACAAACATA 
AGCATGAACT TTGCTTGTAG GACGCAATAT AATTTATTTT GCTAATGACG TTTCTATTGC 
CTTAATCTCA TCTTTAGATA AATTAACAGG TTTCTCTCCA TCTTTGACAT CTTCCTGCAA 
CGCTTTTTGA GCTTCTTTTG AATGATACAA TTCTACGATT TTAGCATATG TTTTGTTATC 
CAAGTCTTTG TCATTAACTG CAACAATATT AATATATGGC TTTACTGCAT CTGAATTTGA 

tttttctaaa aatatcggat catttttagg atctttaccc gctttagttg ctacaccgtt 
attaXtaact gcaatatcga catcagataa agcacqtgca gtttgttgtg catctactgc 

AGTAATTTTT AAATGTTTTG GATTTGACGT TATATCTTTC ACCGTGCCTG CTAATCCGAA 
ATCTTTTTTC AGTTTTATTA AACCAGCTGC TTCTAATAGT TTAAGTGCAC GTGCTTGGTT 
TGACACATCA TTTGGAATGA CAACTTTAGC ACCATCTTTA ACCTTTTTGA CATCTTTAAT 
TTTATCTGAG TAAATGCCCA ACGQTGCTAA AACTGTTGTA CTTAATGCTG AAATCTTTGT 
TCCTTTATGC GCCTTTTTAT ATTGATCTAA AAATGCAAAA TGTTGGAATG CATTCATATC 
AATATCACCA TCATTTAATG CTTTATTCGG -TAAATTGTAA TCTGAGAAGT GCTTAATCTC 
CACATCAATA TCATCTTTTT TAGCTAATT.C TTTAACCTTC TCCCAAGCCT TAGTGTCATT 



1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 
1920 
1980 
2040 
2100 
2160 
2220 
2280 
2340 
2400 
2460 
2520 
2580 
2640 
2700 
2760 
2820 



55 



1097 



EP 0 786 519 A2 



10 



IS 



20 



2S 



30 



3S 



40 



45 



SO 



TCAATTCCTT 


TCAAAATCTT 


2940 


ACATTCCCTA 


GCGTTTGAAT 


3000 


ATGACCGTCG 


TATCAAATCT 


3060 


CCX^CCAACAG 


CTCCTGCCAT 


- 3120 


GCTAATACTA 


ACX3AACCTAA 


3180 


GAAGCGCCCA 


TCGnTTTCGC 


3240 


TCAACAAGTC 


TTGCAATGTA 


3300 


GTACCAATTG 


AAGTACCTAC 


3360 


ATAAATGGTA 


GTGACCTTAA 


3420 


TTGGGCCATA 


TGCCTTGTTT 


3480 


ACTGCTCCTA 


AAAATAAAGC 


3540 


AACTGTGCAC 


TGTCTAAATC 


3600 


.TTTTTCTCTT 


TGAAATATTG 


3660 


CGAAGCCACA 


TATAACATAC 


3720 


TTAACCTCTC 


TGCCACAAAT 


3780 



TTGAATCAAG TCATTTATAA TCGGTTGTGT CACCTGAGTT TCCTCGACGA AGATTTTATA 
ATCTTTAAAA TCGCCAACTT GTTCGTCATT CAATCGACGA ATCAATGATG TACTTGGCTC 
AGTCTGTATA ACTGTAGACA CAAAATTTTG AGCAATCGTC GTTTTAGGAT GACTAAACAC 
CrCTTTAAcA GTTCCTGTTT CAACCACTTT CCCCTTTTCC ATTACAGCAA CACGATTACA 
AATGTCTTTA ATAACGCGCA TTTCATGTGT AATCATCATA ATTGTAATGC CAAAGGTTTG 
ATTGfiCATTC TTTAATAACG TCAATATCGA AGCAGTC6TT GCTGGATCCA ATGCGCTTGT 
TGCTTCATCG CATAGGAGTA TTTTCGGATT AGTAACAAGC GCTCTTGCAA TAGCCACCCT 

TTGCTTCTGC CCACCAGATA ATTCATCAGG AAATTGGTCT TTTTTATCAC TCAATCCTAC 

... • - - 

AAATTCAAGC ATTTCCGTTA CTCGXTGCTT AATTTCTGTT TTGCTTTTCT TACTTAAAAT 
GAGTGGCATT GCTACATTTT TAAATACGGT AGCTGAATTT AATAAATTGA AATGCTGAAA 
TATCATACOG ATATCTTTCT TAATATCCCT CATCATTTTA TCGCTATAAT TCGTAATATC 
ATGTCCATCT ACAATCACTT GTCCATTCGA GGCAGCTTCA AGATGATTCA CGAGTCTTAC 
CAACGTACTT TTTCCTGCAC CACTATATCC AATCACACCA AAAATATCAT TGCGATTGAC 
CGTAAATGAT ACGTCCTTCA AAGCATCTAT TTTTTGCTTC TTTTTATTAA AGGTCTTACT 
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TAAGAGCATT ATATGTAAAA TTGCATATAT 
AATTAAAAAA TAAGTAATTC ATGTGACAAT 
5 CAAATTAAAT CCATAAAAAT GTCCACCAAT 

TCGCACAAAA AAGCACTAGC ATATTCAAGA 
AGTGCTGCTA TTATTTATAA AGTATCTAGT 

10 

GTATCTTCAA TACCTACAGA AATTCTTACA 
ATATCTGCTG GAATGGATGC ATGTGTCATC 
GCACCTAAAC TTTCAGCTAA TGTGTAATAC 

IS 

TCTGTATTTT TCACTTCAAA TGCAATCACA 
ACATCATGAT TTAAATGACT TTCAATACTT 
20 GCTTGTAACA TTTTAATAAT TTCAATAACG 

AATGTTTTAA TACCCCTCAC AAGTAAATAG 
GAATTTGAAA TAAATGCTAA ACGTTCTGCA 
GCAACGACAT CACTATGTCC ACCTAAATAT 
CCTAAATCTA ATGGATTCTG ATAATAAGGT 
AAACCGTGTT CTTTCGCAAT TTCAGCAGAC 

30 

TTAGAAGGTG TTTCAATAAA CAACATCTTT 
TCTGTATGCG TTGTATCTAC AAAATCCACT 
AATGCGCGAT AAGTACCGCC GTATACATCT 

35 

AACAGCATAA CAACTGCACT GATTGCTGCA 
CCATTTTCTA ATGTCGCAAT AACGCTTTCT 

40 GAATATTCAT ATCCTTGACG TAAATCACCA 

TAAATTGGTG TTGTAACGGC ACCTGTATAA 
TTAGTTTTCT TGTTCATTAT TATTCTCCTC 

^ ATCACTACCA TCTGGAAATA CGACAACAAT 
CAATGCACCT TGTAATGCTG CACCTGaAGA 
CAAACTTTTG ACATTTCGAA AGGCATCTTG 

SO 

ACGTCTCTCT AAAAATATCG GCCATTTCTC 
AGCTGGCCCT CCATTTAACA COGACCCTTC 

55 



CXjTcAATACA ATTTGCCGAA TTTTCTAAAA 4740 

GACGAATTGT GAGACTACTA TGACATTTAT 4800 

CCTCCACAAC GCAATTACTA AATATTAACA 4860 
ACAACAAACG TTGAACTCAA AATATATGCC ^ 4920 

GCTTGTnTA AATCATCGAC TAAATCTTCA 4980 

AGTCCGTCTG TAATACCTTC TTTAGCTCGA 5040 

AATGCAGGTA CTGAAATTAA- ACTTTCCACT 5100 

GATGTTCCTT TAATCAATTG TTTGGCACTT 5160 

CCTGTATGGC CATCCGCTTG AGCCATATGG 5220 
GGATGGAACA CTTGTTGCAC AGCTGGATGT - 5280 

CTGCGATTAA TTTGTXCCAT ACGTAAACCT 5340 

CTATCTTGAG GTCCTAAAAT GCCACCTGTT 5400 

AGCTTGTCAT CCGATGTTGC AACTAAACCA 5460 

TTCGTTGCAG AATGTAAGAC AATATCGATA 5520 

GTCATAAATG TGTTATCAAC AACTGAAATC 5580 

TTTTTAATGT CAGTAACACG TAATAATGGA 5640 

GTTGTTGGGC GTATCGCTTG TACAATTGAA' 5700 

TCAATGCCAA ATCGTGTAAA TACTTTTGTC 5760 

GAATTTAAAA TAATATGATC TCCTTTGTCC 5820 

ACACCTGAAC TAAATGCAAA GCCATGTTTG 5880 

ACAGAACTTC TTGTTGGATT CGCAGTACGA 5940 

ATATCATCTT GTAAATATGT ACTTGTTTGA 6000 

TCGTCTGTTG TGTGCCCACC ATGAATTAAT 6060 

ATAATTAAAT ATTTGCTTAG ACATATATCG 6120 

CGTACCTTCA GATAATTGCG CmTAAATT 6180 

ACTGCCTACT AACAACCCTT CATTTATAGC 6240 

ATCTTTAATC GTAAATATCC CATCTACAAG 6300 

AGAACCGATA CCTTCAGTGT CATGTGCATG 6360 
TGGCTCAACG GCATAACATT GCACGTGATG ' 6420 
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AACTAATTGC CATAATACTT GTCCGATGTA AATGACAATC CAACCACCGA TAACACTATA 



AATGTATGAA 


AATATGTATC 


6540 


CCATATTTTT 


CAGCATAGGA 


6600 


CTCGTCCTTG 


AAACTTCTGC 


6660 


CCATACGGCG 


CAAAGATCTT 


6720 


ATGCCTGTAT 


TACCAGCAGT 


6780 


TGAATTGCCT 


TCTCTACTAA 


6840 


CATTGTTCAA 


GCTTGGCATA ^ . 


6900 


AATGGTGTAT 


TGCCaATTAA 


6960 


ATCAAATGAA 


TGAAACCTTT 

• 


7020 


TTATAAACGA 


CATTTTGTTA. 


7080 


CTAAATTTTC 


AATTCCAAAC 


7140 


GCTTCTATAT 


ATTAACTAAA 


7200 


GCATACTTAA 


TTAAGTAATA 


7260 


TGTTGTAATA 


ATTTTTTATC 


7320 


AATGGCATCA 


ATACATTCGA 


7380 


AATCTTACAT 


CTTTTAAGAT 


7440 


AAAATACTAC 


CGATCACTGC 


7500 


GAAACATTTA 


ATTCTAATAA 


7560 


AAGAATCCCA 


AATAGAATAA 


7620 


TTAAATAATA 


ATCCAGGCCC 


7680 


ATAGCTAGAC 


CTGCCAATAC 


' 7740 


GACTTAATCG 


TCATGTCTTT 


7800 


AATGATAACG 


TAAAGAATGA 


7860 

• * • " 


m 

GATACTCTTG 


GTTGTAAAAT 


7920 


TTAATCACAA 


TGACGATTAA 


7980 


TCTAATCCTT 


TTTCAACACC 


8040 


TGCCCTAGAA 


CGGTTAACCA 


8100 


TGATTGATGC 


GTTGAAATAT 


8160 


CAACCACCGA 


TAACACTATA 


8220 
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TTTACCAGTT AATTTACTAT ATATTTGTGT TGTATATGTC CGTCCCATTT TCCCAACAGT 
GAATTCCATA ATGAGTAATG GCAACCCAAC AAAAATGGTG AATATTAAGA ACATAGCTAG 
AAAGGCACCG CCGCCATAAA TCCCTGCCAT ATATGGGAAT TTCCACATGG CACCAAGACC 
GATTGCAGAA CcCGCACTAG CTAAAATAAA TCCAGTTGAT GACTTCCATT GTGATTGTTG 
TCTTTTCATC ATTCAC 

(2) INFORMATION FOR SEQ ID NO: 279: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4326 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : dOXlble 

. (D) TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 279: 
GCTTTGGCCA TTTTATGTGG CGATTGAGAC AATCtGTkGT TGTCTTATTT GATGTTGTAT 
TTCAACTGGT AATTCTAGTT GCGATTGAAA TAATGGCAAC TTTTCCCAAT CATTAACAAA 
TAATTCAATA CCTGCTATGT CTAATACTTT AGCACGTGCA TCATCAACAA GACGGCGTTC 
CAATTGATTT GCTTCTTCTT TAATACCTGG TGACGTACTT TCTAATATCA AATTAGATAT 
AGGGATGTGA CCATTAATTG CATAATATAA TGCAACACGC CCACCCATTG AATATCCAAA 
CAATGTTATT GATTTATCTT TATATTTATC TAAAATTCGG TCTAACAACG TCGTAATATA 
ATCWVAATTC CACGTTTCAT CCATTGAAQA CTGATCTTCG CCATGGCCTG GTAAGTCTAT 
AGTGATGACA TGATAGTTAT CAGTAAATTT TTCGATGTGA TTATGATAAG TACGGCTGTC 
GCTAAGAAAT CCATGCAGAA ATACTAAAAC TTGATTGGTC TCAACGTTTG CTTCATAAAA 
TTTiCrAATGT GTCATGAATC ATTTCACTCA ATTTCTGGTA TAAAATTTGA TGCTGTTTAA 

agtTatcttc gcgattcgtt atcaattcat aaatcgtcga agtttcagat aacaatgtgg 

CATTTTTAAA TTCTGAAACA CTGTTAAAAC GTTTAAAATC GAATTGATAT AACTTAGCTG 
TATACTCGAA ATCCAATCCC GTCGGTGTGC CAAACAACCG TTCAAAATAO TCAGTTGCAC 
TTTCTTTTTG TGGTAAATAT GAAAAAATAC CGCCACCATC GTTGTTCAAT AATACAATAT 
TCATCTGAAT . ATTATTTAAT TTTGACATTA ATAGTCCATT CATATCATGA TAAAATGATA 
AATCACCTAT CAATAATGTT ATTCGTTTAT GCACAGCCAT ACCCAGTGCA GTTGAAACGA 
TACCATCAAT ACCATTCGCA CCACGATTCG CATAGACATC TATATTTTTA TTCAATAACA 
AGTTATCTAC ATCTCTGATA GGCATACTAT TACTAATAAA TAATGCATCT TTTTCAGATG 
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TAATTTCTTT ACGCCCTTTT TTCTCTAAGC ATTGCCATTT TTCTAACCAA CTTACGCGAT 1200 

TAACTGTCGT GTCTTCCATT AATGACCTAA AGAAATCATT CGCAGAAATC TCATATGAAA 1260 

TATCTGGCGC TATCGGAAAG ACATCAATCT TATCATTGTT TTGCACTAAT ATTTGAAATG 1320 

CATCAGTTTT CTTTAACCAT TGATTTAACT TTTTAGAAAT CACTGGTTTC CCAACACGAA 1380 
TTACGAAATC CACATTTAAG TCTAAGCCGC TTCTAAACAG CAAATCATAT GTACAGATAA ' 1440 

CATTCGGATG ATCAAATTTT CTTAAATQAC TTAAAQGATC AGCTAAAATA GGCAAATCAT 1500 

ATATCGTTGA ATACGTTAGT ATTTGaTCAA CTTCTTGGTG CTGCATATCC CCTACAATAA 1560 

TTAAACCTTT TTTCTTATTT AAAATGTGTC TTAATGCCGA TGCATCTATA CTTTTTTGAT 1620 

AGTGCGGTAA AATCTTCATC TCAGAAGTTA ACAATTCTGT TGCATTCAAA TCAGGTGTTA 1630 

ACGGATCTCT AAATGGCAAG TTAAAATGAA TTGGCCCTTT ATGTGGTCCA TATAAATATT 1740 

20 GACTAGCAAT TTGCATTTGA TAGTAAATTG CATCAATGGT CTCTTTACTA TCATCCGCAA 1800 

TAGGCATATC GAACTCATAA CTTACATAAT TATTAAACAT ATTTACTTGA TTAATCGCTT 1860 

GTGGTGCGCC TACACTTCTT AATTCATGCG GACGGTCACT TGTTAAAACG ATTAAAGGAA 1920 

TTCTACTAAT TTGGCTTTCA GCAATTGCAG GCGTATAATT CGCTGCTGCT GTACCTGACG 1980 

TACATAATAT AGCGACAGGT CTTTCACTGC CTTTAATTAA CCCAACTGCA AAAAACGCTG 2040 

CACTTCGCTC ATCGGGGTGT ATCCATGTTT TAATATTTGG ATGTGCTTCA AATGCAAGTG 2100 

CAAGTGGCGT TGAGCGTX3AT CCCGGACTGA TAACTACTTC CCTTACGCCG TACGCATATA 2160 

ACTCAGATGC AAATGTAAAA ACTTGCTTCG TTAAAGCTGC TTTATGATTT CCCATTCATA 2220 

^ TCGACTCCTA ATGCATTCAT CATAGGTGTG AACTTAAGGT TCGTTTCTGC CAATTCACTA 2280 

TCTGGATCAG AATCTTTAAC AATGCCACAC CCAGCAAATA AAGTTGCTTG TGCTTTCTTA 2340 

• • • - - • '■ 

ATAACCATCG AACGAATTGC AACAATAAAT TCACAATCAT CGTATATATC TATATAGCCA 2400 

^0 ACCGGTGCAC CATATAATCC TCGCGTACCA AATTCTTTCT GCTCAATAAA ATCCATTGCA 2460 

AATTCTTTTG GATAGCCACC TAAAGCAGGT GTTGGATGTA AATTATCAAT TAAACTAATA 2520 

TACGAATCAT CCTTCAGTGG CGCCTTTATT TCAGTGTACA AGTGATATAA ATGATCATTT 2580 

TTTAGAATTT TAGGCGTCTT ATCATAATGT AATTCAGTGA TATAAGGTTT AATATCATGT 2640 
AAAATACTGT CAACAACAAA TCGATGTTCG ATTAAGTTTT TATTATCTTT TAAAAATGCT . . 2700 

TCAACATTTT TTGTATCTTC GTCCTCATCT TGTGAACGTT TAATTGTACC TGCTACAGCT 2760 

TTAGTCGATA GTATTTTATT ATTGACCTTT ATTAATTGTT CAGGTGTTTG TGAAAAGAAT 2820 

ATAGAATCTT GTGATTCTAA CAAGAATATA TAACTGTTTT TTTCTTTAGA ATATGCTTGC 2880 
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ACAATTTTTT. CTTCATTATT AATAGATTCT ATAGCTTCTA CTACAAGTTG ACGCCAGTCA 3000 

TCTTTATAAA TATCTTCATT TCTAGTAATT TCCCCAATTT GCTCGTCCAC ATCTATGTCC 3060 

GATATATTGT TGAACAAATC CATTAAATCG TTCAATGCCT CAACAGTAAA ACTTTCCCTT 3120 

TTAACTGTAT AAGTTAAAAA TGTCCCATTA TTATCAGTTG AAATTAAAAC TTCAGGTAAT 3180 

ACAAAATGAT TTAGTCCAAA CTCTCGCCAT TCATCATCTO ATTTATGACT TGAAAATTGG 3240 

AACCCTCCAA CAACTCGAAG ATGATGTTTC TCAGATTGCG GATGTATAAA TGTGATGTTA 3300 

TGTTTTAATT TTTCCCAGTC TTTAAAAATA GATTGTTTAT TTTTAGAATT ATTTTTGAAT 3360 

AATT6AATTG CTTTGTAGCC AAAATATGAC GTTCXIATTAT CATTCAAACG CATATAAAAG 3420 

CGATCTCCTG CCTCATTGTC AGTGAGATGA AATAATGTGC TCGGGTCTAG TGACTGTGAT 34 BO 

AATTTCACTT CAACTGAAAC CCATTCCTTT GAGCTGCCAT ATATCTCTTT GACAATATCG 3540 

20 TCCTCTAATA CGCCCGTAGC CATCCATTTC ACTTCTTTCT TCGTCTTTTT TCACTCATTA 3600 

TTATATTGTA TCATTTTTGG ATAATTGTGT TACAAGAATT GCTTAAACTT ATCTTGCAAT 3660 

TTTTCACGTC AATTGACCTT TATGGTACTT TCTATTAAAA TATCTTTGTT ATAAAAAATA 3720 

TGATTTAAAG AGGTTTTGTA TTCAATGAGT AATCAATATC AGCAATATTC TACAGTTAAG 3780 

AAATATTGGC ATTTAATGCG TCCTCATACA TTAACTGCTT CCGTAGTACC CGTTTTAGTT 3340 

GGTACAGCAG CATCTAAAAT ATATTTTCTT GGTA6CGAAG ATCATATTAA AATCAGCCTA 3900 

TTCATTGCCA TGTTACTAGC ATGCTTACTT ATTCAAGCAG CAACTAATAT GTTTAATGAA 3960 

TACTATGATT ATAAAAAAGG CCTCGATGAT CATGAATCTG TAGGCATTGG TGGTGCCATT 4020 

GTTCGCAACG GTATGAGCCC AGAGCTTGTG CTACGATTAG CCATTGCATT TTACATCTTA 4080 

GCAGCAATAT TAGGTTTGTT TTTAGCTGCT AACTCTTCAT TTTGGTTATT ACCAGTTGGA 4140 

TTAGfiATGTA TGGCTGTTGG TTACCTATAT ACAGGTGGCC CTTTCCCTAT TTCATGGACG 4200 

40 CCTTTCGGTG AATTATTCTC AGGCGTATTT ATGGGTATGT TTATTATCGT TATTGCATTC 4260 

TTTATTCAAA CTGGCAATAT TCAAAGTTAT GTAATTTGGT TAAGTGTACC TATAGTAATC 4320 

ACTATCGG 4328 
(2) JNF0EU4ATI0N FOR SEQ ID NO: 280: 
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(1} SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1450 base pairs 

(B) TYPE: nucleic acid 
so (C) STRANDEDNESS : double 

(D) TOPOUX5Y:' ^linear 
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GTTCAATACA GAAAAAATAA ATTTAGATGT TGAAGCATCC TACAATTAAT ACAGATCCAT 60 

TTCAATATAT TTAAACTAAA ATCTCGGGAT TTCTAAATTT TGAAATTTCG AGGTTTTnAT 120 

ATTTTTATTT AAAATAGCAC ATTTATACTT TATAATAGTA AAGATGAACA TATAAGGAGG 180 

CCAAATCATG GCAAAACATC CATTCGAACA ATTTAATCTA GAATCTAGTT TAATTGACGC 240 

TGTGAAAGAC CTTAATTTTG AAAAACCAAC TGAAATTCAG AATCGAATTA TTCCAAGAAT 300 

ACTAAAGAGA ACAAATTTAA TTGGTCAATC TCAAACGGGT ACAGGGAAAT CTCATGCATT 360 

TTTATTACCA TTAATGCAGT TAATTGATAG TGAAATAAAA GAACCACAAG CAATCGTAGT 420 

TGCACCAACA AGAGAACTTG CACAACAACT ATACX^ATGCA GCGAACCATT TAAGCCAATT 480 

TAAAGCTGGT GTTTCAGTTA AAGTTTTTAT TGGTGGTACA GATATAGAGA AAGATAGACA 540 

ACGTTGTAAT GCACAACCAC AATTGATTAT AGGCACCCCT ACTAGAATTA ATGACTTAGC 600 

20 TAAAACGGGA CATTTACATG TGCACTTAGC ATCATATTTA GTTATTGATG AAGCGGATCT 660 

TATGATTGAC TTAGGATTAA TTGAAGATGT AGATTACATT GCTGCAAGAT TGGAAGATAA 720 

TGCAAATATT GCGGTGTTTA GTGCTACAAT CCCACAACAG TTACAACCAT TTTTAAATAA 780 

ATATTTAAGT CATCCAGAAT ATGTAGCTGT CGACAGTAAA AAACAAAATA AAAAGAACAT 840 

CGAATTCTAT TTAATACCTA CTAAAGGTGC AGCTAAAGTT GAAAAGACTT TAAATTTAAT 900 

TGATATACTA AATCCATACT TATGTATTAT TTTCTGTAAT AGTAGAGATA ATGCAAATGA 960 

TTTAGCACGT TCACTAAATG AAGCTGGTAT TAAAGTTGGT ATGATTCATG GTGGCTTAAC 1020 

GCCaCGTgAA CGTAAACAAC AAATGarACG TATACGTAAT TTaGAATTCC aATACGTTAT 1080 

TGCCaGCGAT TTAGCATCTC GTGGTATTGA TATTGAAGGT GTTAGTCrTG TCATCaATTT 1140 

TGATGTGCCA AATGATATTG ACTTCTTTAC GCATAGAGTC GGACGAACTG GTCGTGGGAA 1200 

TTATTrAGGT GTAGCAATTA CGCTTTATAG TCCTGATGAA GAACACAATA TTTCATTAAT 1260 

40 AGAAGATCGC GGTTTTGTAT TCAATACTGT TGATATTAAA GATGGTGAGT TAAAAGAAGT 1320 

TAAAGCGCAC AATCAGCGTC AAGCAAGAAT GCGCAAAGAT GACCATTTAA CTAATCAAGT 1380 

GAAGAACAAA GTTCGAAGTA AAATTAAAAA CAAAGTTAAA CCAGGTTATA AGAAGAAATT 1440 

TAAACAAGAA 1450 
(2) INFORMATIOK FOR SEQ ID NO: 281: 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1139 base pairs 

<B) TYPE: nucleic acid 

<C) STRANDEDNESS : double 

(D) TOPOLOGY: .linear 
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(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 281: 
AGTCAGGTAT ATCATGCCaT yCTGAATTGG TCGATATTAA TATCAGTGGT GTTAAAGAAC 
GAATTGTATA CCAATAGACG CTTTATATTG TAAAATAGTA TTAAATGCaG AATAGAGAGG 
AGATTTAATG CGATATGACA AATTATAAAG TTGTCGTTTT AGATATGGAT GACACATTGC 
TAAATTCAGA TAATGTGATA TCAGAAGAAA CTGCAAATTA TTTAACAGCA ATTCAAGATG 
AAGGTTATTA TGTTGTTCTA GCATCTGGTA GACCTACTGA AGGTATGATT CCAACTGCTA 
6AGATTTAAA ATTACCTGAA CATCATAGCT ATATTATTAG TTATAACGGT AGTAAAACGA 
TTAACATGAC TAATGAAGAA GTAGAAGTAA GTAAATCGAT TGGTAAGCAA GATTTCGATG 
AAATTGTAGA TTATTGTCGA GATAGAGGCT TTTTCGTTCT TACATATCAT GATGGTCAAA 
TTATTTaCGA CAGCGAACAT GAGTATATGA ATATTGAAGC AGAATTAACA GGTTTACCGA 
TGAAACGTGT TGATGATATC AAAGCGTATA TTCAAGGCOA TOTACCCAAG GTCATGGGTG 
TAGATTATGT AGCGAATATT ACAGAAGCTA GAATTGATTT GAATGGTGTG TTCAATGATA 
ATGTAGATGC TACGACAAGT AAGCCATTCT TCTTAGAATT TATGGCCAAA GACGTTTCAA 

AAGGTAATGC AATTAAAGCG TTATGTCACA AATTGGGATA TTCGGTGGAT CAAGTCATTG 

- - ' . •■ ■ . . - 

CTTTTGGTGA TAGTATGAAT GATAAATCAA TGTTTGAAGT CGCAGGTCTA GCTATTGCTA 
TGGGGaATGC ATCAGATGAA CTTAAGCAAT ATGCAAATGA AGTTACGTTG GATCATAATG 
AAAATGGTAT TCCACATGCG CTCAAAAAAT TGTTATAAAT TTTAAAATAA GCCTTAACAC 
ATGATATTTG AATAAGATAT CTTGTGGTTA AGGCTTTTTA TTTTTGTGAA AATGACTTCA 
GTTATACTAT GGAGGATTTG AAATACATAT TTTAGATTAG TAATGATATC AAACGAATAG 
AGTAAATGTA .TATTTttTGA ATAAATCAAG TATTAACTAG TCACGGAAGG nAGATAAAT 
(2) INFORMATION FOR SEQ ID NO: 282: 

ft 

' (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2931 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double' 

(D) TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 282: 
TCTAAAAATG CTGTGAAATT CTTTTATAAA TATCTAAAAG GAATTAATGT TGATAACATT 
GCTGTGATAG GAAGTAAGAC AGCGCAATAT TGTGAATCAC TTGGCATTCG AGTTGATTTT 
AtGCCAAACG ACTTTTCTCA AGAAGGATTT TTAAAATCAT TTAATCAAAC TAACCAAAAA 
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AATGAAGTTG TTAAAATAGA TTTATATACT TCAGTGCCTA ACAAACAAAA TATACAAGAT 300 

GTTAAAGAAA TGATAGAACA TCAACAAATC GATGCATTAA CATTTTCAAG TTCGTCGGCA 360 

GTACGTTATT ATTTTAATGA AGGATTTGTA CCAAAATTCA AGTCGTATTT TGCTATTGGA 420 

GAACAAACAG CACGGACCAT TAAATCATAT CAACAACCA6 TAACAATTGC AGAAATTCAA 480 

ACACTCGAAT CACTAATTGA AAAGATTTTA GAAAGTAGGG GCTAAAAATG AAATTTGATA 540 

GACATAGAAG ATTGAGATCA TCAGCGACAA TGAGAGATAT GGTTAGAGAG AATCATG7AA 600 

GAAAAGAAGA TTTAATATAT CCAATTTTTG TAGTT6AAAA AGACGATGTG AAAAAAGAAA 660 

TTAAGTCATT GCCAGGTGTA TACCAAATCA GTTTGAAnT ACTTGAAAGT GAATTAAAAG 720 

- • • ■ . * 

AAGCTTATGA CTTAGGCATA CGTGCCATTA TGTTTTTCGG TGTTCCAAAC TCAAAaGATG 780 

ATATAGGTAC TGGT6CATAC ATTCACGATG GTGTTATTCA ACAGGCAACA CGTATTGCTA 840 

AAAAAATGTA TGATGACTTA TTAATTGTTG CAGACACTTG TTTATGTGAA TATACTGATC 900 

ATGGTCATTG TGGCGTGATT GATGACCATA CACATGACGT TGACAATGAT AAATCATTGC 960 

CACTACTTGT TAAAACAGCA ATTTCTCAAG TGGAAGCTGG TGCTGATATT ATTGCGCCAA 1020 

GTAAXATGAT GGATGGTTTT GTTGCTGAAA TTCGTCQTGG ATTAGATGAA GCCGGCTATT 1080 

ACAATATTCC TATAATGAGT TATGGTGTCA AGTATGCATC AAGTTTCTTT GGACCTTTTA 1140 

GAGATGCAGC AGATTCAGCG CCATCATTTG GGGATAGAAA AACGTATCAG ATGGACCCTG 1200 

CTAACCGTTT GGAAGCACTT CGTGAATTAG AAAGTGATCT TAAAGAAGGG TGCGACATGA 1260 • 

TGATTGTTAA ACCTGCTCTA AGTTATTTAG ATATAGTTCX5 AGATGTTAAA AATCATACGA 1320 

ATGTTCCAGT TGTTGCATAT AATGTGAGTG GAGAATATAG TATGACTAAA GCAGCGGCAC 1380 

AAAATGGTTG GATAGATGAA GAACGTGTCG 7TATGGAACA AATGGTTTCA . ATGAAACGTG 1440 

CAGGTGCTGA TATGATTATT ACGTATTTTG CAAAGGACAT TTGTCGCTAT TTAGATAAAT 1500 

AAGGTTTTAT ATTTATGATT TTCCATAAAC TGTAGGAGGA ATTTACTTTA TGAGATATAC 1560 

GAAATCAGAA GAAGCAATGa AGGTTGCTGA AACTTTAATG CCTGGTGGTG TAAATAGTCC 1620 

AGTACGCGCA TTTAAATCAG TAGATACACC AGCAATTTTT ATGGATCACG GTAAAGGTTC 1680 

AAAAATTTAT GATATCGATG GTAACGAGTA TATCGACTAT GTACTAAGTT GGGGACCACT 1740 

TATTTTAGGA CATAGAGACC CTCAAGTTAT TAGTCATTTA CATGAAGCAA TTGATAAAGG 1800 

. ~ • ' . .... . . 

TACAAGTTTT GGTGCATCAA CATTACTTGA AAATAAATTG GCGCAgcTCG TTATTGACCG 1860 

AGTACCTTCA ATAGAAAAAG TGCGTATGGT GTCATCTGGT ACAGAAGCTA CATTGGATAC 1920. 

TTTAAGATTA GCACGTGGTT ATACTGGCAG AAATAAAATT GTGAAATTTG AAGGTTGCTA 1980. 
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GCCGGATTCT CCTGGTGTGC CTGAAGGTAT TGCTAAAAAT ACAATTACAG TTCCATACAA 
TGATTTAGAT GCACTTAAAA TCGCTTTCGA AAAATTTGGa AACGATATTG CTGGTGTAAT 
CGTAGAACCT GTTGCTGGTA ATATGGGTGT CGTACCGCCG ATTGAAGGTT TTTTACAGGG 
ATTAAGAGAT ATTACGACTG AATACGGCGC ATTGCTAATT TTCGATGAAG TAATGACTGG 
TTTCAGAGTC GGTTATCATT GTGCACAAGG TTACTTTGGT GTGACACCAG ATTTAACTTG 
CTTAGGAAAA GTTATCGGTG GAGGACTACC TGTAGGTGCA TTTGGTGGTA AAAAAGAAAT 
CATGGATCAT ATAGCACCAT TAGGAAATAT TTATCAAGCG GGTACGTTAT CAGGAAATCC 
TCTTGCAATG ACAAGTGGTT ATGAAACGTT AAGCCAATTA ACGCCAGAGA CATATGAGTA 
TTTTAATATG TTAGGCGATA TACTTGAAGA CGGTTTAAAA CGTGTATTTG CTAAACACAA 
TGTACCAATA ACTGTAAATA GAGCAGGTTC AATGATTGGT TATTTCTTAA ATGAAGGACC 
TGTAACTAAT TTTGAACAAG CGAATAAAAG TGATTTGAAA TTATTTGCAG AAATGTATCG 
AGAAATGGCA AAAGAAGGTG TGTTTTTACC ACCATCTCAA TTTGAAGGTA CATTCTTATC 
TACGGCACAC ACGAAAGAAG ATATTGAAAA AACGATTCAA GCATTTGATA CGGCTTTAAG 
TCGTATTGTA AAATAAATAT ACX5GACAAAT TGAGAGCCTG AACTTTGTTC AGGCTCnTTT 
TAAATGTATA TAAGGCATGG GCGGCGACTT GATAGTGAAA GTCCACTACT A 
(2) INFORMATION FOR SEQ ID NO: 283: 
(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1421 base pairs 

(B) ^ TYPE: nucleic acid 

(C) STRANDEDNESS : doxible 

(D) TOPOLOGY: linear 

* * , * 

r(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 283: 

■ 

AATTATGAAT GCATTACCAG TATTATTACA AAAGAACAAT TAAAAATGTT TGTTTATGAT 
TATGATACGC ATCTCATTAA AAATGTAaTG GTTGCAGCAG ' ACGTGTTAAA GGCAAATGAT 
ATTCAAGGAC ATGAACCATT AATCGTTAAC CTTCAAACGA TTGATGAAAC ATTACATCGT 
TTACCTATGC ATAATAGAAA AGACATGATG GTTAATGGCG GTGTACTTAT GGCACATTTA 
AATGCCAAAA GTGGTCCGTG GTTAAAAGAT GTGCTAAGAC AAATTGAGAT AGCGATTGTA" 
ACAGGTAAAG TAAGCAACGA AGAAACTGAA ATTTTGAAAT GGGTGGATAA TCATGTCAAA 
ATATAGTCAA GATGTACTTC AATTACTCTA TAAAAATAAA CCGAATTATA TATCTGGACA 
AAGCATTGCG GAATCACTTA ATATTTCACG CACTGCAGTA AAAAAAGTGA TTGACCAATT 
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CCCAGATATT TGGTATCAAG GTATAATAGA CCAATATACA AAAAGTTCTG CTTTGTTTGA 

TTTTAGTGAA GTATACGATT CAATAGATTC TACACAACTT GCTGCGAAAA AGTCACTTGT 

TGGAAATCAA TCTTCATTTT TTATCTTGAG TGATGAACAA ACGAAAGGTC GTGGGCGATT 

TAATAGACAT TGCAOTTCTT CAAAAGGGCA AGGACTTTCG ATGTCTGTCG TGTTAAGACC 

TAACGTTGCA TTCTCAATGA TATCTAAATT TAATTTATTT ATTGCATTAG GGATAAGAGA 

TGCGATTCAA CATTTTAGTC AAGATGAAGT CAAAGTGAAA TGGCCX3AATG ATATATTTAT 

TGATAATGGT AAAGTGTGTG GTTTCTTAAC TGAAATGGTT GCTAATAATQ ATGGTATAGA 

AGCAATAATA TGTGOTATAG GTATTAATTT GACGCAACAA CTAGAAAACT TTGATGAAAG 

TATTAGACAT AGAGCAACAA GTATACAATT ACATGATAAA AATAAATTAG ATAGATATCA 

ATTTTTAGAG ATATTACTTC AAGAAATTGA AAAAAGATAT AATCAATTTT TAACX5TTACC 

TTTTTCTGAA ATTCGTGAAG AATATACTGC AGCTTCTAAT ATTTGGAATA GAACXSTTGCt 

ATTTACAGAA AATGATAAAC AGTTTAAAgG ACAAGCAATT GATTTAGATT ACGATGGCTA 

TCTAATTGTT AGAGATGAAG CGGGTGAATC ACACCGTTTA ATTAGTGCAG ATATAGATTT 

TTAACACTAA AGCAAGGAGA GATAGCTATG GGTATGGCAA CCTATGCCGT TGTGGATTTG 

GnAACAACAG GCAACCAATT AGATTTTGAC GATATCATTC A 

[2) INFORMATION FOR SEQ ID NO: 284: 

(i) SEQUENCE CHARACTERISTICS: 

<A) LENGTH: 2202 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 
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-(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 284: 

* 

CCAAGTTGCC TAAAATGATT AAGCAAGGTT TATACCCTAT GCnAACGATT GAACAAGAAT 
CTGGAGCCAT CCGACTGCCA ACGATTTCTA GAGTGAnGCG TTCATTACAA TGGGGTAATG 
ATGCTTATAC AATGATTTTA GATCGTATGA ATAITGAAAC AAATGAATAA TAAATGAACG 
ATAAACAATG GTTATCTATC TGCACTAATA AGGTAGATAA TCATTGTTTT TTCACGAAAA 
AATTTACAGA GTAAAAGAAC TTAAATTTCA TATTAAGTCT TTAGAACTCG ACACTTAAAA 
SO ATGCTATAAT CATATGTATG TTAAAAAAGG AGTTTCGGAA AATGTATGAC ATTAAAAAAT 
GGCGCCATAT TTTTAAATTA GACCCAGCTA AACATATTTC AGATGATGAT TTAGATGCGA 
TTTGTATGTC TCAAACAGAT GCAATTATGA TTGGTGGAaC TGATGACGTT ACTGAAGATA 
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CAAACATCGA AAGTGTAATG CCTGGTTTTG ATTtTTATTT TGTACCTACA GTACTGAACA 
GTACAGATGT TGTATTTCAC AATGGTACAT TATTAGAAGC GCTTAAAACA TATGGACATA 
GTATAGATTT TGAGGAAGTA ATATTTGAAG GGTATGTCGT GTGCAATGCT GATAGCAAAG 
TGGCAAAACA TACCAAAGCA AATACAGATT TAACAACAGA AGATTTAGAA GCATATGCCC 
AAATGGTCAA TCATATGTAT CGATTACCGG TTATGTATAT AGAGTATAGT GGCATTTATG 
GCGACX5TATC AAAGGTTCAA GCTGTCTCAG AACATCTAAC AGAAACGCAA CTTTTTTATG 
GTGGCGGTAT TTCCTCAGAA CAACAAGCGA CAGAGATGGC AGCTATTGCA GATACAATTA 
TCX3TCGGTGA TATTATTTAT AAAGATATTA AAAAAGCTTT. AAAAACAGTA AAAATAAAGG 
AGTCTAGTAA ATGAATGCX;T TATTAAATCA TATGAATACA GAGCAAAGTG AAGCTGTAAA 
GACAACAGAA GGACCATTGT TAATTATGGC AGGTGCTGGT TCAGGGAAGA CACXJTGTTTT 
AACACATAGA ATTGCTTATT TATTAGACGA AAAAGATGTC TCACCATACA ATGTTTTGGC 
TATTACTTTT ACAAATAAAG CTGCAAGAGA AATGAAAGAA CGTGTTCAAA AATTAGTAGG 
TGATCAAGCA GAAGTTATTT GGATGTCAAC ATTCCACTCA ATGTGTGTTC GTATTTTACG 
TCGTGATGCA GATCGAATTG-GTATAGAACG CAATTTTACG ATAATTGATC CTACAGACCA 
AAAATCTGTT ATTAAAGACG TCTTAAAAAA TGAAAATATT GATAGTAAAA AGTTTGAACC 
TCGTATGTTT ATCGGTGCGA TCAGTAATTT GAAAAATGAA CTTAAAACAC CTGCAGATGC 
TCAAAAAGAA GCCACAGATT aTCACTCgcA AwTGGTaGCA ACgGTTTaTA GTgGATATCA 
ACGCCAATTG TCACGTAATG AAGCGTTAGA TTTTGATGAC CTTATTATGA CAACGATTAA 
CTTATTTGAG CGTGTACCAG AAGTTCTAGA ATATTATCAG AACAAATTCC AATATATTCA 
TGTAGATGAG TATCAAGATA CTAATAAAGC ACAATACACA TTAGTIAAAT TATTAGCAAG 
TAA^TTAAA AACTTATGTG TTGTAGGTGA CTCAGATCAG TCAATTTATG GTTGGCGTGG 
TGCTGATATT CAAAATATCT TATCATTTGA AAAAGACTAT CCAGAAGCGA ATACAATCTT 
TTTAGAGCAA AATTATCGTT CGACGAAAAC GATTTTAAAT GCGGCTAACG AAGTGrTTAA 
AAATAATTCT GAACGTAAGC CAAAAGGACT GTGGACTGCA AATACGAATG GTGAGAAAAT 
TCATTACTAT GAAGCAATGA CGGAACtGAT GAAGCGGAAT TTGTAATACG AGAAATTATG 
AAGCATCAAC GTAATGGTAA GAAATATCAA GATATGGCAA TTTTATATAG AACGAATGCA 
CAATCACGTG TACTTGAGGA AACATTCATG AAATCTAATA TGCCATACAC AATGGTTGGT 
GGCCAAAAGT TCTATGACCG TAAAGnAATC CAAAGATTTA TT 
(2) INFORMATION FOR SEQ ID NO: 235: 
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(A) LENGTH: 785 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : doui>le 

(D) TOPOLOGY: linear 

*' 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 285: 
AGTGGTGCAA AGATAGGCAT TGATaATACC GCTAAGCCAG CAAGATGATG GCACGATAAA 
ACCTAAACAG AAGAAmATAA ATAGTAATAC GATGATAAAT AATGGTCCAC TCATATGTTG 
AACTAAAGAT GATGAAAAGT GTAAGATTGT ATCTGAAATC ATACCTTCAT TCAACACTAA 
ATTAATACCT CGAGCTAAAC CAATAATTAA . AGATACACCT ACTAAACTTG ATGCACCATT 
GACAAATGCA TCTACAGTTC CTTTTTCTCC CAATCCAGAT TTACCTGTCC CAGCAATAAA 
CATTATTATA ATTGTAAATA TTAAAAATGC TGAAGCCATA ACTGGGAACC ACCAACCTTG 
CGTCATAACT CCCCATACCA TAATTGGAAA TGGTAGTACA AATAATGTAA GGATTATCTT 
CTTACGCAAA GTAAAATGGG CACTATCGTC ATCTTTTAAT ACAGACCATT GCTGTTCAAA 
AGCATCTTTG TCTTCATAAG AATATGACGC TTTAGGATCG TTTTTAATTT TTTTACAGTA 
CCAATATAAA TAACTAATAA CAAAAATCGC ACCGACAATA CAAGCACCTA TTCTCCAATA 
CAAGCCATCC GTAAAAGTTG TACCAGCGGC ATTAGAGGCA ATTACAACCG AGAACGGGTT 
AATAGTTGAA AATGTACTAC CGACAGAGCT GGcAAGGAAT ATGGCACCAA CTGGAAACGA 
TAGAATCGTA TCCTAACGCT AATAAATATA GGGACTAAAA TCGGATAAAA TGCTACAGCT 
TCTTC 

(2) INFORMATION FOR SEQ ID NO: 286: 

(i) SEQUENCE CHARACTERISTICS:. 
_ (A) LENGTH: 812 base pairs 

- (B) TYPE: nucleic acid 

(C) STRANDEDNESS: doxible 

(D) TOPOLOGY: linear 

{xi) SEQUENCE DESCRIPTION: SEQ ID NO: 286: 
CTAACGnGAT AAGGTTGCAA nTTTATCTGA ACATCTGATG ACTGTAATTT TGTtAATGAT 
AAAATATTTG TCACTAATAG ATATAAATAC TGACTTTCTT GAAAACTATG TACAAGTAAT 
TGTTCCTTTT CTATGATAGA CATATCTTTA CTATGTGATA CTAAAATATC TAAATkTCCC 
ATAATTGTTG TTAACGGTGT ACGTATGTGA TGCGAAATTG ATCTTAAAAA ATTTGAATGT 
GTCAGTTGAC GTTCAGCCTG TAACATGGAT TCTCTCGTTT GTTTAAGTAA CGTCACATTT 
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ATCACTTGAG AACTTTGGTA ATCAATGGCT AGAATGCCTT TAATCGGAGA TGTGCCAATT 420 

GGTATCAACC ATTTATTAAT GCCTGGAAAT GTATCTGTTG TTGCACCAGC TTGTCTTTCA 480 

5 TTTITAATTA CCCAGCTTAA TGCTTGTTCA TGCTGTTGAG TCGTATTATC GATATGGTTT 540 

TGCAATGGTA TTGTTTTAAT TACTTTCGAT TGATTGATAA CGTATATAGT AATTGATTGT 600 

TGCAATAATT GATTAATTTG GTATCCAGCA TTTATTAGTA AGTTTTCAAC TGTATAAGTT 660 

TO 

TGTTTAATCG AATCATTAAA TTGAAATAAT AAATCTGTAC GATAAAGTTG CTTTTTAGTA 720 

ATGGaGTAwT GGAATTTAAT TTGTnTTAAT AAAGCACTCG TTAAAATACT TGTnAAAATG 780 

CTAACGATAA ATGTAATAGG ATAGTCAAAG CG 812 

IS 

(2) INFORMATION FOR SEQ ID NO: 287: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1732 base pairs 
20 (B) TYPE: nucleic acid 

(C) STRANDEDNBSS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 287: 

... ' - . 

ATnnATTATT ATTACTGCTA TTTTAAATTT TAAAAAATGC TTTTGATTAT ATTCAACAnT 60 

TTGTATAAAA TTAAATTTGC TTTTGATTAA AGCATGAAAA TTGTAATCAA ACCATAAATT 120 

30 

GTCGTATGAT GTAGTTAGAA TTTTAAAATG CAGGAGGTCa AGTATATGAC TGAAATaACA 180 

TTCAAAGGTG GACCAATCCA CTTAAAAGGT CAACAAATTA ATGAAGGTGA TTTTGCACCT 240 

GATTTTACAG TGTTAGATAA TGACTTAAAT CAAGTAACAT TAGCAGATTA TGCTGGTAAA 300 

35 

AAGAAATTAA TTAgTGTGGT ACCATCAATT GATACAGGTG TTTGTGATCA GCAGACTCGC 360 

AAATTCAACT CTGATGCTTC TAAAGAAGAG GGGATTGTGC TTACAATTIC AGCAGACTTA 420 

40 CCATTCGCAC AAAAAAGATG GTGCGCTTCA GCAGGTTTAG ACAATGTCAT TACATTAAGT 480 
GACCACCGTG ACTTATCATT TGGTGAAAAC TATGGCGTTG TTATGGAAGA ACTTCGCTTA * 540 

TTAGCTCGTG CAGTATTTGT ATTAGATGCA GATAATAAAG TTGTTTATAA AGAAATCGTT 600 

^ AGTGAAGGTA CTGATTTCCC AGATTTTGAT GCTGCTTTAG CTGCATACAA AAATATTTAA . 660 
TCATTAAAGA GATAAATCTT AAAATGTATA CATCGTGTCC ATCGTTGTCA ACAGCATTAA . 720 

AATAGAATTG TTTTCTATGA TTGCTAAGAC CTATGGGCAC TTTTTATTGG AGAGGGACGA 780 

SO 

ATATGGCAGA ACAACAAACA ATTATGGAAC GCTTGTTTCA TACATTAGAT GAAAAAGCTA 840 

AAACATTAAA TAATGAAAAT GGCCaAAGTT TTATTGAAAA TCTTGGGCTA GCAATGGAAC 900 

ss 
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CATTCCAATT TGCATATTTA AGTTTAATGC aGGAAGAAAA GATAcAAGCA AATCATCAAA 
TTACACCAGA TTCAATTGGA TTGATACTAG GATTTTTAGT TGAGCGTTTT ATGAACAACC 
AAGAAGAATT ACATATTGTT GATATTGCAA GTGGTGCCGG TCATTTAAGT GCTACTGTAA 
AAGAAGTGTT ACCTGraAtT GcGGTTATGc ATcATTTaAT TGoLAGITGAt CCAGTTTTAT 
CACGTGTTAG TGTACATTTA GCAAACTTCT TAGAAATTCC TTTCGATGTG TATCCTCAAG 
ATGCCATCAT GCCACTACCA TTAGAAGAAG CAGATATCGT TATTGGTGAT TTTCCAGTAG 
GCTATTATCC AATTGATGAA AGAAGTAAGG AGTTTAAGCT AGGTTTTGAA GAAGGACATA 
GTTATTCACA TTATTTATTA ATAGAACAAG CAATAAATGC ATTAAAAGAT GCTGGATATG 
CCTTTCTAGT GGTACCAAGT AATATTTTTA CAGGTGAACA TGTAAAACAG CTTGAAAAAT 
ATATTGCAAC AGAGACAGAG ATGCAAGCAT TTTTAAATTT ACCACCAACT TTATTTAAAA 
ATGAAAAAGC GCGAAAATCT ATATTAATTT TACAAAAGAA AA^TCGGGT GaAACAAAGC 
CAGTTGAAGT ATTATTGGCA AATATTCCTg ATTTCcAAAA TTCCTTCACC AATTTCCAAG 
QATTTATGGA CAGAGTTAAA ATCCAGTGGG ATGGGACCAC CAAATCGTCC TA 
(2) INFORMATION FOR SEQ ID NO: 288: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2779 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear ' ' 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 288: . 
AAAAGAACTA GCTAAACGCA AGCAAGAAGC TATTAGTAGA ATTAAAGACT TTTCAAATGA 
AAAAATAAAT AGTATTCGAA ATAGTGAAAT TGGCACAGCT GATGAAAAAC AAGCAGCAAT 
GAATCAAATT AACGAAATTG TGCTTGAAAC AATTAGAGAT ATTAATAATG CGCATACATT 
ACAGCAAGTT GAGGCTGCAT TGAACAATGG TATTGCTCGA ATTTCAGCAG TACAAATTGT 
AACATCTGAT CGTGCTAAAC AATCGTCAAG TACTGGAAAT GAATCTAATA GCCATTTAAC 
AATTGGTTAT GGAACTGCAA ATCATCCATT TAACAGTTCG ACTATTGGAC ATAAAAAGAA 
ACTTGATGAA GATGATGACA TTGATCCACT TCATATGCGT CACTTTAGTA ATAATTTCGG 
TAATGTTATT AAAAACGCTA TTGGTGTGGT GGGTATCTCT GGTTTACTAG CTAGTTTCTG 
GTTCTTCATT GCCAAACGTC GTCGTAAAGA AGATGAAGAG GAAGAATTAG AAATAAGAGA 
TAATAATAAA GATTCAATAA AAGAGACTTT AGACGATACA AAACATTTAC CACTTTTATT 
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10 



IS 



20 



2S 



30 



35 



40 



45 



SO 



AAATAATGGC GAGTCACTCG ATAAAGTTAA ACATACGCCG TTCTTCTTAC CAAAACGTCG 
TCGTAAAGAA GATGAAGAAG ATGTGGAAGT TACAAATGAA AACACAGATG AAAAAGTGTT 
GAAAGATAAC GAACATTCAC CACTCTTATT CGCAAAACGA CGCAAAGATA AAGAGGAAGA 
TGTTGAAACA ACAACTAGTA TTGAATCTAA AGATGAGCAC GTTCCTTTAT TATTGGCTAA 
AA^GAAAAAT CAAAAA6ATA ACCAATCCAA AGACAAAAAG TCAGCATCAA AAAATACTTC 
TAAAAAGGTA GCAGCTAAAA AGAAGAAAAA GAAAGCTAAG AAAAATAAAA AATAATTXGT 
TTCTTTGATA AATAGaGGAG CACCGATTGA CATCACATCA GTCGGTGCTC CTTTTATTTA 
TTCTTTTTAA TTAATTTATA CTAATGCCTGT TGAGCGTGTT GATTCGCTTC TTTGTTTTGT 
TCTCTCGGTA TCCATTTAAC AAATAATAAA TGAAAATCTT TTTCAAATAT TTCTATTTGA 
TCAAAATAAS GTTTGAAATT TGCX5TTTTTC ACATAACCAG CTTCAATGCT ATCTGCAATT 
AGCTTTGAGT CTGTATATAA TAGTGCGTTT TGAACATTTA ATTCACGTGC ATGTTCTAGT 
GCATAAATAC ATGCAGCCCA TTCTGCAGTG TGGTTATCCA TTTCGCCTAA CTCATGTGTA 
TATGTATAAT GCTGCTCATC TTCTTTGATT ACAATGGCAC ATGTACTTAT GCCTGGATTT 
CCTTTCGTCG CAGCATCAAA ATTTATTTTC GCCATAATAA ACCTACTTTC- TATTCAATAC 
TTAGTTAAAG TTACTATTAC TGTAATACAA AATATGTTGG GTAATCCATT AAAAAACACG 
CATCACTTAA ATAAGTAACA CGTGTTTAAA ATACTCGCTG ATTCAAAGAT GATTTTCTAA 
TACGTAtACT GTaATATACT TCCTAAAAAA ATCATCTTCA GGCTGGGACA TAAATCAATG 
TTCTATGCTC TACGATGTTA TATTGGCAGT AGTTGACTGA ACGAAAATGC GCTTGTAACA 
AGC T TTT TT C AATTCTAGTC AGGGGCCCCA ACACAGAGAA TTTCGAAAAG AAATTCTACA 
GGCAATGCGA GTTGGGGTGT GGGTCCCAAC ACAGAAOATG ACGAA^TC AGCTTACAAT 
AATGTGCaAG TTTGGGATGG GCCCCAACAA AGAGAAATTG GATTCCCAAT TTCTACAGAC 
AATCklAAGTT GGGGTGGGAC GACGAAATAA ATTTTGCGAA AATATTATTT CTGTCCCACT 
CCCTTAAAAC TTATTC T TTT GTGTAGTAAG TGCGTTAATA GCCTTGATCT AACTTATCAA 
TCTTACCTTT ACGATAAAAT GATTTAGCAA TATATCCAAA TGGTACATTG AAAACTGTTG 
AAGCTAATTT TAATACGTAC GTTGTAATAA ATATTTCAAa TACAAcnTGTa CCAGGTAAAC 
TTCCGATAAA TGCGATAGCT ACAAATAAAG CTGTATCAAT TATTGrGCTT AAAAATGTAC 
TACCATATGg CACGGATGAA AAACGTTTTa TQnGaACTAA ATACTTTTTT AATTAGTGAA 
AAGATAAATA CATCAATATG TTGACCAATA ATATATGCGA CGATTGAGCC TAAAGCAATG 
CGTGGCACAA CATCAAAGAT TGCGTGTAAT GCTTTTTGTG CCATATCTTC TGGTGCAGGA 



720 
780 
840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 
1920 
1980 
2040 
2100 
2160 
2220 
2280 
2340 
2400 
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CAAACTGCTC TTTTTGCAAC TCTACGCCCA TAAATATCGT TTAATATATC TGTTGCTAAA 

TAAATAGAAG CAAACATGAC ATTACCTAAA GTTGCTGAAA TACCAAAGAT TTCTACAGTT 

TTAATCACTT GTATGTTGGC AATGATTGTG CCAATTGCAA CCCATGCAAT TAAACCTTGT 

TTACCAAAAA AGCGATACAT AAGTACCATA AGCACGAACG TTGCAATAAA CGTAACTAGT 

CCTAAAATTT CATTATACAT ATTAAAATGT CCTCCTAAAT TTTGATCATG CGGGTGTTTA 

GAAACCGCTC AATAAATAA 

(2) INFORMATION FOR SEO* ID NO: 289: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1999 base pairs 
(3) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



2520 
2580 
2640 
2700 
2760 
2779 
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(xi) SEQUENCE DESCRIPTION: SSQ ID NO: 289: 
ACTGATGTGC GTTCATCAAA AACAATATAA TCAAATTCAT TTTCATCAAA TTGCTTAAAA 
TTATCATCTC TAGATAATGT TTGAATGGTT GCAAATAAAT ATTTGGCATC GACATCTCTA 
TGTTTTCCTG TCAACAATCC AAAATCAGTA TCATTTTTTA TAGGTAATAC TTTTTTAAAT 
TCTTCCTTAG CTCTATTTAA AATCCCCTCA TTATGAACAA TAAATAAAAA TTTATTAGGG 
TTTACTTCTC TAACATCTAA TGCACATAAA ATCGTTTTAC CTGTACCAGT TGCAGATATT 



ATTAACGCCT TATCTTTGGC TTTATCCCTA ATAGCTTTTA ATGACCTTAA TGCTTCTGCT 
TGCATTAAAT TGGGTACAAT TTCCACTGAT TTTTTCACCT TATCAGCTAG CAGCATTTGA 
GTTTGTTCAA CCTCOGCTAA TTTTTCTAAG GAACGGTACT CAAATGATTC TTTATATGAA 
TTAMCGATT GCTCAGTCAG TGGGGTACTC TTTTGCCATA ACAAGTCAAA TTCACTTTTT 
ACACTATCAA CTAAATCGCC ATTTTTCATA GTAGACAGTA AAACATTATG CTCATAATTA 
ACCTTTAACG CATTAGATGT TAAATTAGAG CTTCCTATTA CCATAGAACT ATAATCCTTA 
TGCTCAAAAA TATATCCTTT GGCATGGAAT CCAGCAATAT CAGTTAATCT TACCTCTACA 
TTTTTTAATT TAAGTAATTC TCCATACATT TTAGGACTAT TAAACCCTAA GTAATTAGAT 
GTTAATATTT TCCCTTTAAC ACCCTTATTG CTTAAATCTA ATAGTTGAGC CTTTAAGCTG 
GcTAAACCGC TTTCTGTTAT AAAAGCCACA GAAAAATAAA ACGTTTCACA TTTTTGAAGT 
TCATCTATAA TTGTTGAAAG AACTTTTTCA TTTTTATTAT TTACTAAAAG CTTCGGTGTA 
TAATTCCCTT TATGAGAAAT ATGTTTGTCT ATAAACCCTT TATGTAAAGA TTGATTGAAA 



60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
840 
900 
960 
1020 
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CGCTGGGGCC CAATTTAATT TATCAAGTTC GTTTATTGAC AACCATTCAA TACTCTTATG 
TTCAGTTAGA GTTGGTAACT CTTTGTTTAA AGTACATTTG TATGTTGTTA ACCTAACAAT 
TCCAAAATCA TATTCATGTT CTGTAGTTAT AACTTTGTCT CCAACAATTA AATCACATTT 
CATTTCTTCT CTAATTTCTC TAATCAAAGC GTCTTTTTCA GTTTCATTCT TTTCAACCTT 
ACnGCCAGGA AATTCCCACA TTAAAGGCAG ACTCATTTTT TCACTTCTCT GTGCACAAAG 
AATTTTGTTA TCAGAAAAAA TAATAGCTCC TACTACATTG ATTACTTTTT TCATAAGACT 
CACCCTTCAA TTTAAAATCA TCTTAATTGT TATTCTATCA AAAATTACAA AACTATATAT 
AAATCAATAT TAAAAATTAA TATTTTACAT TCACATGAAC GCTCTACTCC ATGCATTTTC 
ATACACATCT ATTATATAAT ACTTGTGAAA AGTATTGTCT TGGGGCTGTG TTTTTTTACT 
TTTGGGGCGT ATTTCTTTAT AATTCATTAC ATAAATGTAA GGGCTTTAGT TTTCATGTTr 
TATTAAGTCT AACTGAGATT TTGAAAGGAT GTTTAGCAAC AATGGATAAA GAATTATGGA 
TAGAACGAGc TAATGATAGT TTAGTTAAAC ATTTTTATGa GCAGCAATCT GACATTGAAC 
AGCGAGAAGG TTTTGAAAGT AAATTAACAT TTGGTACrGC GGGTATACGC GGAAAATTCG 
GTCTTGGTGA AGGTCGACTT AATAAGTTTA CTATTGAAAA ATTGGCATTA GGTTTAGCGC 
GTTATTTAAA TGCCCAAACA AACAGTCCAA CAATAGTCAX TCATTATGA7 ATTAGACATC 

t 

TTTCcAACTG AATTCGCCC 
(2)* INFORMATION FOR SEQ ID NO: 290: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1933 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 
1920 
1980 
1999 



40 



45 



SO 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 290: 
GATGACTTTT CCCCCTCATA ATCTTCATGG TCCAGGCGTC CATTAATGCG TCAAAGGATG 
GCACATTTTA CCTGGAACAA ATGATTCATA TGGTTCATAA AAATCACGCG TCGTAATATA 
ATCTTCTAAA TCAAATGCAT AGAAAATCAT TGGCTTTTTA AATACTGCAT ATTCATATAT 
TAAAGATGAA TAGTCACTAA TTAATAAATC TGTTATGAAC AGTATATCAT TAACTTCTCT 
AAAGTCAGAA ACGTCAACAA AATATTGTTT ATGTTTGTCT GCAATATTAA GTCTATTTTT 
CACAAATGGA TGCATTTTAA ATAATACAAC CGCGTTATTT TTTTCGCAAT ATCTTGCTAA 
ACGTTCAAAA TCAATTTTGA AAAATGGGTA ATGTGCTGTA CCATGACCAC TACCTCTAAA 



60 
120 
180 
240 
300 
360 
420 
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ITGTTTGATC 


TOTGTCGCAT 


AAGCTTCATC 


AAATAGTACA 


TCAGTACGTG 


GAACACCTGT 


540 




AGGCACTACA 


TTTTTCTCTT 


TAATACCAAA 


TGCTTCAGCG 


TAGAATGGAA 


TATCGGTTTC 


600 


5 


AGATCATACA 


TAAGCTTTTG 


TATAGCTACG 


ATGATTTAAT 


GAATCAATAA ATGGTCCACC 


660 




CTTTTTACCA 


GTACGACTAA 


AGCCAACTGT 


TTTAAAGGCA 


CCAACGGCAT 


GCCATAu 1 i G 


720 




AATAACTTCT 


TGAGAACGTC 


TAAAAGGCAC 


TGTATAAATC 


AATGGGTGAA 


AGTCATCAAC 


7B0 


10 


AAAGATGTAG 


TCTGCCTTCC 


CAAGTAAATA 


TGGCAATCTA AACTTGTCGA 


TGATGCCACG 


840 




TCTATCTGTA 


ATATTCGCTT 


TAAAAACAGT 


GTGAATATCA 


TACTTTTTAT 


CTAAATTTTG 


900 


IS 


ACGTAACATT 


TCGTTATAGA 


TGTATTCAAA 


GTTTCCAGAC 


ATCGTTGGTC 


TAGAGTCTGA 


d60 


TGTGAACAAC 


ACOGTATTCC 


CTTTTTTCAA 


GTGGAAAAAT 


TTCGTCGTAT 


TAAATATCGC 


1020 




TTTAAAAATA 


AATTGTCTTG 


TATTAAATGA 


TTGTTTGCGG 


AAATACTTAC 


GTAATTCTTT 


1080 


20 


ATATTTACGA 


ACGATATAAA 


TACTTTTAAC 


TTCCGGAGTC 


GTTACAACAA 


CATCAAGOAC 


* 1140 




AAATTCATTA 


ACATCGCTAG 


AAATTTCAGG 


TGTAACAGTA 


TAAACCGTTT 


TCTTCGAAAT 


1200 




GCCGCCTTTT 


CTAAATTCTT 


TTAGGTAAGT 


CTGCAATAAG 


AAATTGATTT 


TACCATTTTG- 


1260 


25 


TGTTTCTAAT 


TCGTTGTATT 


CTTCTTCTTG 


TTCTGGCTTT 


AGATTTTGAT 


ATGCATCATT 


1320 




AATCACATCT 


GGGTTTAACT 


GTGCAATATA 


ATCAAGTTCT 


TGCTCATTCA 


CTAATAAGTA 


1380 




CTTATCTTCA 


GGTAAGTAAT 


AACCATTATC 


TAAGATAGCT 


ACATTGAAAC 


GACAAACGAA 


1440 


30 


TTGATTCCCA 


TCTATTTTGA 


CATCATTCGC 


CTTCATTGTA 


CGTGTCTCAG* 


TTAAATTTCT 


1500 




TAATACAAAA 


TTACTATCTT 


CTAAATCTAG 


GTTTTCACTA 


TGTCCTTCAA 


CX3AATAACTG 


1560 


3S 


AACACGTTCC 


CAATAGATTT 


TATCTATATA 


TATCTTACTT 


TTAACCAACG 


TTAATTCATC 


1620 


CTTTTCTATT 


TACATAATCC 


ATTTTAATAC 


TGTTTTACCC 


CAAGATGTAG 


ACAGGTCTGC • 


1680 




TTCAAAAGCT 

* 


TCTGTAAGAT 


CATTAATTGT 


TGCAATTTCA AATTCTTGAC 


CTTTTAACAA 


1740 


40 


CGCTAATTTA 


nCTACAATAT 


CTGGGTATTG 


AATGTATAAG 


TCTACAACAT 


CTTGGAAATC 


1800 




TTTTGAACCA 


CTTCGACTAC 


TACCAATCAA 


CGTTAGTCCT 


TTTTCCAATA. CTAGACGTGT., 


1860 




ATTAACTTCT 


ACTGGGAACT 


CACTTACACC 


TAACAGTnCA 


ATGCTTCCTT 


CTGGTGAAAT 


1920 


45 


GTAATCGATC 


ATT 










1933 




(2) INFORMATION FOR SEQ ID NO: 291: 









(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2049 base pairs 

(B) TYPE: nucleic acid . 

(C) STRANDEDNESS : double 
{D) TOPOLOGY:, linear 
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(xi> SEQUENCE DESCRIPTION: SEQ ID NO: 291: 
nGTnCGGnCA GATATATTGG TGGTCTTTAG TAAGTGTATC AAATTCATCA GATGTCAAGG 
GCATGTTATC ACCTCCTTAG GTTGATAACA aCATTATACa CGaAAGGAGC ATAAaCAAaT 
GAACACAaGA TCAGAAGGAT TGCGTATAGG CGTCCCACAA GTTTCTAGCA AAGCTGATGC 
TTCTTCATCC TATTTAACGG AAAAGGAACG TAACTTAGGA GCGGAAATAT TAGAACTTAT 
TAAAAAAAGT GATTACAGCT ACTT AGAAAT ' AAACAAAGTT TTCTATGCAT TAGATAGAGA 
ACTTCAATAC AGGGCGAATA ATAACAAACT TTAaCATTTA TCTAAAGGAG TGATAGAGAT 
GCCAAAAATC AXAATACCAC CAACACCAGA AAACACATAT GGAGGCGAAG AAAAATTTGT 
GAAAAAGTTA TACGCAACAC CTACACAAAT CCATCAATTG TTTGGAGTAT GTAGAAGTAC 
AGTATACAAC TGGTTGAAAT ATTACCGTGA AGATAATTTA GGTGTAGAAA ATTTATACAT 
TGATTATTCA GCAACGGGAA CATTGATTAA TATTTCTAAA TTAGAAGAGT ATTTGATCAG 
AAAGCATAAA AAATGGTATT AGGAGGATTA TCAAATGAGC GACACATATA AAAGCTACCT 
ATTAGCAGTG TTGTGCTTCA CGGTCTTAGC GATTGTACTC ATGCCATTGC TGTACTTCAC 
TACAGCATGG TCAATTGCAG 6ATTCGCAAG TATAGTGACA TTCATATTTT ATAAC3GAATA 
CTTTTATGAA GAATAAAAAA ACTGCTACTT GTTGGAGCAA GTAACAGTGC AAGATGAGCA 

ATTGTCTTAA ATAATTATAT AAGGAGTTAT TAATATGACC TTACAACAAA AAATACTATC 

* . -■ 

ACATTTTGCA ACATATGACA ATTTCAATTC TGATGATGTT GTTGAAACTT TTGGGATATC 
TAAAACACAT GCAAAATCCA CACTTTCAAA ACTTAAGAAA AAAGGAAAGA TTGCAATGGA 
AAGTTGGGGT GTCTGGCGTG TTATTGAATC GCAATTGCAT .TTAAGTGTAG TCGAACGTAA 
AAAAGAAATT TTAGAAGAAC AATTTGAATT GTTAGCAAGA TTAAATOAAC AAAGTGATGA 
CCCTAGAGAA ATAGAAGAAC GTATCAAGTT AATGATTCGT CTAGCTAACC AATTTTAAGG 
AGGAGTTAAT CAATGGCAGT ATTAGAAGGT ATTTTTGAAG AATTAAAACT ATTAAATAAG 
AACTTACGTG TGTTAAACAC TGAACTATCA ACTGTAGATT CATCAATTGT ACAAGAGAAA 
GTTAAAGAAG CACCAATGCC AAAAGAAGAA ACAGCTCAAC TGGAATCAAT TGAAGAAGTT 
AAGGAAACTT CTGCT G ATTT GACTAAAGAT TATGTTTTAT CAGTAGGAAA AQAGTTCCTT 
AAAAAAGCAG ACACTTCTGA TAAGAAAGAA TTTAGAAATA AACTTAACGA ACTTGGTGCG 
GATAAGCTAT CTACTATCAA AGAAGAGCAT TATGAAAAAA TrGTTGATTT XATGAATGCG 
AGAATAAATG CATGAAGCTA GATCACTCAA ATAGAGCTCA' TGCAAAGCTT AGTGCAAGTG 
GAGCAAAACA ATGGCTAAAC TGTCCACCGA GTATTAAGGC AAGTGAAGGT ATTGCAGATA 



60 
120 
130 
240 
300 
360 
420 
430 
S40 
600 
660 
720 
780 
840 
900 
' 960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
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GTCTTAAATA TGAAGGCCTA ACACAGTTTG AGTTTAATAA AGCTTTTCAA AATTATAAGC IBOO 

GAAATCAATA TTACAGTGAA GAGTTGCGCG AATATGTTGa AGAGTACGTA GCTAATGTAG IB 60 

AAGAAAAGTA TAACGAGGCT TTGaGTAGAG ATGACGATGT AATAGCTTTA TTTGAAACAA 1920 

AATTGGATyT AGGTAAATAC GTCCCTGAAT CTTTTGGTAy TGGTGATGTC AtTATATTTT 1980 

CAGGTGGTGT ACTTGAAATT ATTGACCTTA AATACGGTAA AGGCATTGAA GTTTCAGCTA. 2040 

TAGATAATC 2049 
(2) INFORMATION FOR SEQ ID NO: 292: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 942 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOIiOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 292: 



TTCATCTTCA TTACTCCTtt ACATAAAAAA TTCATTATAT TGATGGTGCT TTAGATAAAT 



CTGCAAACGA TCGCGCAAAT TTAATAATAT TTTGATAGAC TTTCTTATCT TGATGATAAA 



CATCTCTACC ATGAAAAGTA TGACTTTCTT CCGAATGAGG CAATCGGCTT TTCACTTCAT 
CAATTTCGAT AACTTTTTTA ATACCTTCGT AATGTTTAAT ATGACTTAAA GAACCATTAT 
CAGGTGTAAT AATGTAAT6A CCTGAATATG TTAAGCAAGC AATGTCCGCC TATCACTACC 
TACACCCGGG TCTACCACTG ATACAAAraC TGTGCCTTTA GGCCAGTATT TTACAGTTTG 



AACACGTATA TCATCATTAC AGTATATGCA ACTCCATACA TT 
(2) INFORMATION FOR SEQ ID NO: 293: 



GCCCTAAAAT 


60 


ATCTTGTTTT 


120 


TTAGATAAAT 


IBO 


TCTTGATTGA 


240 


ACATTAACAT 


300 


TGATGATAAA 


360 


GCCAATGGAA 


420 


GTAACAGAAT 


480 


TTAATTGCCT 


540 


TATGCATAAA 


600 


TTCACTTCAT 


660 


GAACCATTAT 


720 


TATCACTACC 


780 


TTACAGTTTG 


840 


TTAAGTTTTC 


900 




942 
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(A) LENGTH: 1263 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
(0) T0P0LCX3Y: linear 



(xi) SEQUENCE DESCRIPTION: SBQ ID NO: 293: 

TO TGTAATAAAA TTTTATGnAA CATGCTGnGA TGCTACCATG AACCTTCTTC ATTTCTTTAT 60 

GTGAGATTGT GaAATTAATC AAATAATAAT ACGGTGGATA CTTTCCTAAT TTACGATATT 120 

CCATTTCCTG ACGATAAAAT GTTAAATAAT CATTTTTTTG AACATCCAAT ATTGAATAAT 180 

GATCTGGATT ATACGTTTGA ATGATGACTT GACCTGCCIT TTCATGACGA CCAGCTCTAC . 240 

CAGCCACTTG CGTTAATAGT TGATAAGTAC GTTCGCTCGC CCGAAAATCA GGTAAATTTA 300 

ACATTGTATC TGCATTCAGC ACACCAACTA AAGTAATATT TGGATAATCT AATCCTTTCG 360 

CAATCATCTG AGTACCTAGT AAAATGTCAC CGTTACCTTT TTCGAATTCA GTCAATAACT 420 

TTTCATGTGC ACCTTTCTTT GAGGTTGTAT CTACATCCAT CCTAATTATG CGCGCATCTT 480 

CAAATTCTTG TTGCAATAGT TCTTCAACTT TCTGAGTACC AGTACCTAGT TGTCGAATGT 540 

GTTCACTCTC ACAATTTGGA CATTGATTCG GTGGCGTCTC TTGGTAACCA CAATAGTGAC 600 

ATTTTAATAA GTCTGTCGTT TTATGATACG TTAATGAAAT ATCACAGTTT GGACATTGCG 660 

GTACATATCC ACAATCCCGA CATAACATAA ACGATGCATA ACCACGTCGA TTTAAAAATA 720 

• * ■ ' 

AAACAACTTG TTCCTGTCGA TCTAATCTTA ATTGTATGGC TTCACGTAAA TCTTTTGAAA 780 
ACATTGACCG ATTACCTTCA CTCAATTCTT CACGCATGTC TACTATATCA ATTTCAGGTA • - 840 

3S AAGCTTGTTG GTTCACTCTG TTTGGTAATG ATAGCAAATG ATAAACGCCT TTTTCAGCTC 900 

GTGCATAACT TTCAAGACAT GGTGTTGCAC TTCCTAAAAT GACTGGACAG TGATGATATT 960 

CAcraCGCCA TTGGGCAATT TCTCTAGCGT GATATCTCGG ATAATCTTCT TGTTTATATG 1020 

TAGATTCATG TTCTTCATCA ATQATGATTA ACCCTAAATT TTTGAAAGGT GCGAACACAC 1080 

TTGACCTTGC ACCAACACTT ACTCTCGCAC GACCATCCCT AATTTTTTGC CATTCATCAT ' 1140 

AACGTTCCCC ATTAGATAAG CCAGAATGTA ATACAGCAAC GTCATCACCA AATCGACGTT 1200 

TGAAGCGTAA AACCATTTGC GGTGTTAGAG CGATTTCAGG AACTAACATC ATCGCCTGTT 1260 

TTCCTTGG * 1268 
5^ (2) INFORMATION FOR SEQ ID NO: 294: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 629 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 294: 
TACCACCAAA TAATATATTA GCTGGCATTT TAATAACATT TAnATTTGTC ATGATATCAT 60 
CAATAAAATG TTGAAACTTC GTAATTTCAC CTTCATAATC ATCAATTGCT GCTAATTGCG • 120 

w 

CACTCGATGC TTGCTGATCT AAATTTAAAA TATTCGACAT GCGTTGACTA TAATAAACTA 180 

AATGTTCTAT TAAGCCATCG TCACTCTTTT CCTTTGGTGC TGACATGACA GCGATACGTT 240 

TCAAAGGATA GTGTTGCGCC AATTTTAATG TCATTAATCC ACCTAAAGAC ACACCCGTTG 300 

CACTGATAGA TTCATAACCT TCATTGACTA AAAATTGGTA AGCTTTCTCA ACTTCTTCCC 360 

ACCAATCATC TACATTATAT GTCATGAAAT CTTTCAACAA TAAACCATGA CCTGGATAAT 420 

• - ■ 

TCGGTGCATA ACAACTAAAT CCTTGGTCAT TTAACTCAGC TGCAAGATGC TTCACATCCC 480 
GATTTGTACC TGTAAATGAA TGTAATAATA ATATCGCATG TCCATTTGTG CCTTTTAAAT 540 
ACGtGGACTC GGTGTTTTAA TTCTCATTTT TCtaTATAcC TCCACTAtGT CTAAAGaJcGT 600 
TkGCTAAACG CGTTGtCGTC GATGATTAA 629 
2S (2) INFORMATION FOR SEQ 10 NO: 295: 

* • ■ • 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2817 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : do\lble 

(D) TOPOLOGY: linear 
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40 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 295: 

. TATGAAAGTA ATGAATGGTA ATATTATTAA ATTTGATGGA AAAGTAGATA TTGATAATGC 60 

AGA*:»ATATC GGTTTTTTAA TTGAGCATCC TAAATTATAT GATAATAAAT CAGGATTGTA 120 

TAACTTGAAA TTATTTGCAC AAGTATTAGG TAAGGGTTTT GATAAAGCAT ACACAGACAA 180 

AATTATAGAT GCATTTGGTA TGAGACCTTA TATTAAAAAG AAAGTTAAGA AATATTCAAT 240 

GGGGATGAAG CAAAAGTTAG CAATTGCAGT ATCTTTAtTG AATAAACCTA AATTTTTAAT 300 

4S CTTGGATGAG CCTACAAATG GltATGGATCC AGATGGCTCa ATTGATGTGC TGACTACAAT 360 

TAAGTCTTTA GkAAATGaAC TTGATATGAG AATTCtAATA TCAAGTCATA AGTTAGAAGA 420 

TATTGAATTA ATTTGTGATA GAGCTGTATT TTTAAGAQAC GGnCATTTTG TTCAAGATGT 480 

AAACATGGAG GAAGGTGTTG CATCTGACAC AACGATAGTT ACTGTTGATC ATAAAGACTT 540 

TGATAGAACT GAAAAATATC TTGCAGAGCA TTTCCAATTA CAAAATGTCG ACAAAGCAGA^ 600 
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ATTAGATATT TATCCCiAAAT ATATTGAAAC ACGTAAAAGT TCATTGCGTG ATACGTACTT 720 

CAATATAAAT CAAAGAGGTG ATAAATAATG AGAATTTTAA ATTTAGTTAA GTATGATTTT 780 

^ TATAGTATAT TTAAaArTCC TTTAACATAT TTAGCGaTAC TAGTCGTATC TAGTTTGATT 840 

GCAACTCAAA GTATACTTAT GGGAAATTCG ATGGATAACC CGAAACATAT TATTGTCTAT 900 

GGATCTGTAT TTGCTGCAGC AAAATGGTTA TTGTTAATAA TTGGATTAAT GTTTGTTGTT 960 

10 

AAGACAATTA CXKX3TGATTT TTCACAAGGT ACAaTTCAAC TATATATGAG TAAAGTTAAA 1020 

ACACGCX3TTG GAtACATTAT TTCGAAAACA ATTTCAATTa TTTTAATTTC AATATTATTT 1080 

GCATTAATTC ATTATGTGAT TTTGATTGTT GTGCAGGCAT CTAGTAATGG AAAAAATTTG . 1140 

IS , . - . - 

GCGTTTTCTA AATATGTAGA TAATTTATGG TTCTTCCTAA TCTTTTTACT ATTCTTTGGC 1200 

TTGTTTTTAT TCTTAATCAC ACTTGCATCA CAAAAAACAG CAATGATATT TTCATTAGGT 1260 

20 GTATTTTTAG TACTCATTGT ACCGTTTATT AAACCTTTTA TTACATTTAT CCCAAGATAC 1320 

GGTGAAAAAO TTTTAGATGC TTTTGATTAT ATCCCTTTTG CTTACTTAAC TGATAAAATG 1380 

ATTAGCTCTA ACTTTGATTT TAGCAATTGG CAATGGGTAA TTTCATTAGG TTCTATAGTG 1440 

' ATATTCTTCA TTTTGAATAT ' CTTATATGTC GCTAAAAAAG ACATyTAATA AAAATAATTT ISOO 

TGAGGTTGGG AATTTTAAAT TTTCCCAACC TCAAAGTTTG TCTTATTGTA AATTTATTTA 1560 

TTTTCTAATT TATTTAGGAT GGAATTATAA ACTGCTTTCC AAAATGAAGC GTCAGTTTTA 1620 

30 

TAGCGGTTTG ATATAACTAA GTGTGTTTCT TTTTCTAAAT CTGCATAGTC TGGATGATCT 1680 

TTGCTCGGTA ATTTATCAGC ACGAACATCA GTTACAAATT TTTGGACTTC ATTTGCTCTT 1740 

GGTCCCCAAA CTGTTTCTTG TTCX3AATTGA TCATTCAAGA ATACGAAGAT AGGAATTGCA 1800 

35 

CGTOATTTAC CATTTGTTAA ATATTGATCG ATCAGTTTTG TATCATCATC TCTATGGAAC 1860 

ACGCGTACTT CTAAATTTAA TGCTTCACTG ATGTGTTTTA GAATTGGGAG ATTCATCATT 1920 

40 GCATCTCCAC ACCAGTCTTC AGTAATTACT AATACTTTAG AATAATTCAT CTCTTTTATT 1930 

TTTTTGATGC GTGAATCATC TTCTGGTAAC TCAAATGATT GATAGATACT GAGAACGGTA 2040 

TCTTCATTTG TCTTCATTCC ATCAATGTAT TCATTTAAGG GTTGGCTATT TTTGAAATAA 2100 

45 GTTTCTAAAT TTGTC A TT G T AAAAACCTCC TTTAGCATTT ACAACATTAT ACCAATTTAT 2160 

AGTAATAAAA GGTAATGAAA TAAATTAATT GCAAATTCTT TGTTAATTTT TGTTAAGGAT 2220 

GAAACGGGAA GCACCTTATG CTATATTTAA ATAAGTACAA AGAAAGGGTG ACATCAGTGC 2280 

SO 

GTATTCAAAA TCX3CTGGGTT GTGTTTATAT TATTTTTAAT CTGTTCTTTT GGTGTATTAA 2340 

TTGGTTTATA TCAATATCGT CATACGAAAA CTGTGGATTT GTCTAATCTT GAAATAAACG 2400 

55 



1121 



EP 0 786 519 A2 





TTGATCGTTT 


TAAArriTAT 


AACAGTAAAG 


CTCACCCTGA 


TCTTACCGTT AAAGTGAGAG 


2520 




AAAAGGATAA 


CATCGTTAAG 


GGGATAATAT 


TAGTAAGAGA TGAAAAGATA CATACTAATT 


2580 


f 
9 


TTGAtGGGGG AATTGGTTCG. CCCyiTAAATA ACGCgATTGA AAATCTTGGa TTCgGATATA 


2640 




AAAGrACaAA AGTTGGcAAT GrtTkCtCAT CgGTAAAGTA TATTGATAGA GATAACCATT 


2700 


10 


TAAAATTAAA CTTACTTTAT 


CAAGATTTAG 


AAATTAAACG 


TATTGAATTT TTTAGTAAAT 


2760 


AGCTTTAGGT 


CTTAAAGTTw 


TAAAAAACGA 


ATGAaTAATT 


TTATTGGGAT GAGTGAC 


2817 




(2) INFORMATION FOR SEQ ID NO: 296: 






15 


• 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1607 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 






20 


(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 296: 






TCTGTTAAAA 


TGATTTTTCT 


TTTAnAAAGG 


CCGnAAATCA ATGTTCGATT nTTATTTGCA 


60 


25 


TTATGGTCrC 


GATATTGGTA 


GAATATCAAA 


TGGTTAAATG 


AGAAAAACTT GGAGGTGCTC 


120 




ACATGTCATC 


AATCGTAGTA GTTGGGACAC 


AA7GGGGAGA 


CGAAGGAAAA GGAAAAATAA 


130 




CGGATTTCTT 


GGCAGAACAG 


TCAGATGTTA 


TCGCGOGTTT 


TTCAGGTGGT AATAATGCAG 


• 

240 




GCCATACCAT 


TCAATTTGGC 


GGAGAAACAT 


ATAAATTACA 


TTTAGTACCA TCTGGTATCT 


300 




TTTACAAAGA 


CAAATTAGCG 


GTAATCGGTA 


ACGGAGTCGT 

• 


TGTTGATCCA GTTGCACTAT 


360 


• 

35 


TGAAAGAATT 


AGACGGATTA AATGAACGTG 


GCATTCCTAC 


AAGTAATTTA CGTATATCTA 


420 


ATCGTGCGCA 


AGTGArriTA 


CCATATCACT 


TAGCACAAGA 


TGAATATGAA GAACGTTTAC . 


430 ' 




gTGGtOACAA 


TAAGATTGGT 


ACAACTAAAA 


AAGGTATCGG 


TCCAGCATAT GTAGACAAAG 


540 


40 


TTCAACGTAT 


CGGTATTOGT 


ATGGCAGATT 


TACTTGAAAA 


AGAAACATTC GAAAGATTAT 


600 




TAAAATCAAA 


CATTGAATAT 


AAACAAGCAT 


ATTTCAAAGG 


TATGTTTAAC GAAACATGTC 


660 




CATCATTTGA 


TGATATCTTT 


GAAGAATATT 


ATGCAGCAGG 


TCAACGTCTA AAAGAATITG 


720 


45 


TAACAGACAC 


ATCAAAAATC 


TTAGACGATG 


CATTTGTAGC 


AGATGAAAAG GTACTTTTCG 


. 780 




AAGGTGCGCA 


AGGTGTAATG 


TTAGATATCG 


ACCATGGTAC 


ATATCCATTC GTTACATCAA 


840 




GTAATCCAAT 


TGCAGGTAAC 


GTTACTGTTG 


GTACAGGTGT 


4 

AGGTCCTACA TTCGTTTCAA 


900 


SO 


AGGTAATTGG 


TGTATGTAAA 


GCTTATACAT 


CACGTGTTGG 


TGATGGTCCA TTCCCTACTG 


960 




AATTATTCGA 


TGAAGATGGA 


CATCATATTA 


GAGAGGTTGG 


TCGTGAATAC GGTACAACAA 


1020 

* 
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TAAGTGGTAT TACAGATTTA TCTATTAACT CAATCX5ATGT TTTAACAGGC CTAGACACAG 
TGAAA^TCTG TACAGCTTAT GAATTAGACG GTAAAGAAAT TACTGAGTAC CCAGCAAACT 
TAGATCAATT AAAACGTTGT AAACCAATCT TTGAAGAGTT ACCAGGTTGG ACAGAAGACG 
TAACAAATGT GCGTACTTTA GAAGAATTAC CTGAAAATGC ACGTAAATAT TTAGAGCGTA 
TTTCAGAATT ATGTAATGTA CAAATTTCTA TCTTCTCAGT TGGTCCAGAT AGAGAACAAA 
CAAACCTATT AAAAGAATTG TGGTAGAACT TTATATAAGT CATACACAAT GATTATAAAT 
ACATGAGCCT TCTATCTTTA TTGGTAGGAG GCTTTTGTTA TGCTTGCTTC TGTATCGATT 
CGATTATTTA GATAAAA^T ACTAACGTAA AGGCGATATT TGCTAGTCAT AATTTAGAAG 
rTTAgATGAt AtTtAACQAA AAtTAAgATG ailATACtTGA ATGGTAA 
(2) INFORMATION FOR SSQ ID NO: 297: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3 055 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 297: 
TTAGAAGTAA GCACTTTAAT ATCTTTACCT ACCCATGTAC CAACACCTTC TTTAGGCTTT 
GGATTTTCAG CATGGTTATT TQATTTATTC ACCTGTTCAG ATCTATTTAC TTTATTACCT 
TTATTCGGGT TCTCTAATAC ATCAAATTTT AATCTCGGTG AATAAAAAAG ATATATTAAA 
AATCCAACTA AAAATAATAC ACCGACQACT CTTATAATTA ACTTTTTCAT CAATCAACCA 
CCTAAAAAGT ATTAATACTA TTGTAAAAAA CAACACATTA ATTAGCAAAT TTTCAACACT 
gacaJaactg TGTCGTTTCG ATAAAACAAA ATCATCTTCA GGCATAATTT TAACGTCATA 
AAGATTTTCC CTACACTCTA TATCATAACC TATCTTTATG TTTTCAGGTr GAATTTCATT 
ATTAAGATTA AAATATGTAT AAAAAAATGG ACAGTTAAGG TATCAAATGA ATACCATCAA 
CTGTCCGACT ATTCTTCATC AAAAAACCTG ATAAAACAAA TTGCCTTATC AGATTAGTAT 
CATTTGTATA AGCATATTAA TGACCAAATG TTGCTTTAAT CAGTGATGTC GTTTCTCCAC 
CTGGATATAA TACATATAAT AATAAGTAAA CTGCTACACC TGTAATTGCA GTACAGAACC 
ATATAACTGA AGCGAATGGC CCQAATTTGC GGTGTACATT ATATTTATCT TTAAATGCAG 
TAATAATTTG AACTAGGCCT AGAATACCAC CAATTGTTGC TAAATTAATG TGGAAMATA 
AGAAAATCGT ATAATATTTC TTAATTGATG CTGGTCCGCC AAATGCTGTA TTACCGATAA 
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TAACATTTTT GTCTTTATTT ATTTCCCTTT TCCAAATAAG TCTCCAACCA ATGGCAATTA 960 

AAATTGCACT AATGACAATA CATGTCGTAC TAATCGTTGG TAAAATTGGA ACGCCCATAT 1020 

TTTTCATCCT AACTTAATTA ATCTAGATCA AAGTAAGTAA TGAAACAATC ACAGCTAACA 1080 

CGAAAAAGAT CACTAAATAA TTTAGTGAAT ATATAAACAT TTGTGTTGCC CATTTTGTTT 1140 

GATCTGAATT TTTCTTAAAT GTTGTTAAAC CTAATGCAAT CCATCCTAAA TTTAATAAGG 1200 

TrGCTAACAC TaCGAATACG ACACCTAAAT TTATTAGTAA TAAAGGTACT GGCAATAAAA 1260 

TAATCAACCA GATAAACATA CTGACACGTG TACGTTTAAA GCCCTTAACT GATGGTAACA 1320 

TTCGAATATT TGCAAGTGCA TATTCATCTT TACX5TTTAAT AGCTAAGGcA TAAAAATGAA 1380 

TTGGtTGCCA ACmAAATACA ACTAAAAACA GCGCAATCGC TGTTAAACTA ATTTGTCCTT 1440 

CAATTGCAAC CCATCCAATT AGTGGTGGTA CTGCTCCAGG AAAACTCCCA ATCACTGTGT 1500 

20 TCCATGTTGT ATGTCTTTTA GACCATATTG AGTAATAAGA CACATAACCT ACAATCCCCA 1560 

TAAGACCAAG TACGCCTGAT GGTATATTCA ATAAAAACAA ACAAATTTCT CCAACTAACA 1620 

TCATACCAAA AOTAATAGT AATAAATTTT GATCTGTAAT TCTATTATTT ACAGTTGGTC 1680 

25 TATTTTGTTT ACTAGGCATA ATACGATCAA TATCTTGGTC GTAATAATTA TTTAACGCAC 1740 

ATGCGCCACC CATAATTAAA GTAGATCCAA ATAGCATTAA TAAAATTTGA GGTATTGATG 1800 

ATAAGAAGGA ATGATTTGTC ATTACAACTG CTAGCCATGC GCcCGCAAAA GCCGGAATTA 1860 

AGTTACCTTG AACAAGTCCC ATTTTAATTA TCTGTTGCAA TTCTTTGAAG TTAACTCTGC 1920 

TAATATTTTG TGACmAAGTA TGCTCTTTGC TCATAATCCC CCTCCTTAAA TTTGTTCATA 1980 

TAAGATTATG ATATCTTAGA TTGCATAAAA AGACTAGGTT TAATAAAATT AAATTGTGAC 2040 

AAATTAACGA CAAGAGAAAA TGTCAATTTT GTGACACAAA TAACATTTAA TTTATTGCTA 2100 

TAATGTATAT GTTAGAAAAT TTTAATAAGT AGAATCATGC ATCTAAAAGA GATTAATATT 2160 

TAAGCTTCAA ATTTGAGTAA ACGTOGATTA CATAATTATC CCAATAAAAA AATCATTACG 2220 

ATTAAGTTCT TTTTATGTCG . TCCACATACA ATACTTGTAA AATTAAATCA TATTTCCTGC 2280 

GTTGGATCCC ATCTTTTCAT ATCCTACAAT CAGGTCTATT TATAGTATCA TCTCAAATCC 2340 

45 GGCTATTAAT TCTAATTCTC AGTGATGCGT TTTTTTATGA TGGGGTGTAT AAATTGTTTG 2400 

GCAAAAAGAA TTTAAAATGG TTAGGTGTCX3 TAGCAACGTT AATGATGACA TTTGTACAAC 2460 

TTGGTGGAGC CTTAGTTACC AAAACCGGAT CAGCTGATGG TTGTGGTTCT TCTTGGCCAC 2520 

^'^ TATGTCATGG TGCGTTGAIT CCAGAATTCT TTCCTATTGA TACGATTATT GAGTTAAGTC 2580 

ATAGAGCCGT TTCAGCTTTG TCTTTATTAA TGGTCTTATG GTTAGTTATC ACTCCATGGA 2640 
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15 



TATTGCAAGC ATTAATCGGA GCTGCTGCTG TTATTTGGCA ACAAAACX3AT TACGTTTTAG 2760 

CATTGCACTT TGGTATATCA TTAATCAGTT TCTCATCTGT ATTTTTAATA ACATTGATTA 2820 

TTTTCTCTAT AGATCAAAAA TATGAAGCTG ACGAATTATA TATCAAAAAG CCATTAAGAC 2880 

GTTTAACATG GTTAATGGCA ATCATCATTT ATTGTGGTGT TTATACTGGT GCACTAGTGa 2940 

GACATGCGGA TGCAAGTTTA GCATATGGTG GTTGGCCATT GCCATTACCA CGATCTTGTA 3000 

CCACATTCAG GAACAAGATT GGGTTCAACT CACGCATCGT ATCAnGGTCn nTTAA 3 OSS 
(2) INFORMATION FOR SEQ ID NO: 298: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 748 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDBDNESS : double 

(D) TOPOtOGY: linear 

20 

ixi) SEQUENCE DESCRIPTION: SEQ ID NO: 298: 

TTCTTATTTA AAGAAGTCAT TTTTAGAAAT TGTTGAGACT TTAAAAAATG ATCCGTATAA 60 

AATAACACAA TCTTTTGAAA AATTAGAGCC TAAATATTTA GAOOGATATT CAAGAAGAAT 120 

TAACCATCAG CACAGGGTCG TCTATACCGT AGATGATCGA AATAAAGAAG TATTAATACT 180 

* 

ATCGGCATGG TCACATTATG ATTAATGAAT ATTCAATATC TGAATAACTT TAATGATAAG 240 

TTAATTAAAG AAACTAGTAT TTAAGTGTAG GGAAAATAGC GACGTTAATG CGTTGTTATC 300 

TCTACACTTT TTAATTTTAT AATAGCGCAA GACTAAACAG ATTGAAATTA GTAACAATAA 360 

AAGAATAACG TAITATTATA AGGAATTTTA AATTGTGACT TTTTCGQAAT ATTAAATTTT 420 

AGAAATATGA GGTTTTTAAG CGGATTCCTC ACAAAATTTT AAAAATATTT AAGCCTGAAA 480 

ATGATAAAGC GGTAGGGAAC GTTTTTCTOA AaGTTAGTGA TACAATAGTT TTAAGTTGAA 540 

ATACAGGAGG ATGAATAACA TGAATCAGTC AGTCAAATTA CTTAAACATT TAACAGATGT 600 

AAACGGCATT GCTGGTTATG AAATGCAAGT TAAAGAAOCA ATGCGTaACT ATATAGAGCC - 660 

TGTCAGTGAT CaAATTATTG AAGATAACTT GGGTGGCATT TTTGGAAAGA AAAATGCTGA 720 

45 GAATGGTCAA TACTCAATTA TGGAnTTC 748 
(2) INFORMATION FOR SEQ ID NO: 299: 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4718 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDBDNESS: double 
(O) TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 299: 
ACCTCCGAAT AATTGATTCC ATTAACITTT TTTGTGaAAA AtTTAAACAG GCGAAGTCTT 
CAATAAGTGA AGATGTCCAA ATTATAAAAA ATACATTCCA AAAAGAAAAG TTAGGTACAG 
TAATTACtAC ycTGGCGCAA GTGGTGGTGT TACGTATAAA CCAATGATGA GTAAAGAAGA 
GGCGACTGAA GTTGTTAATG AGGTCATTAC TCTATTAGAA GAGAAAGAAC GTTTGTTAcC 
TGGCGGATAT TTATTTTTAT CAGATTTGGT AGGTAATCCA TCGCTACTAA ACAAAGTTGG 
TAAGTTAATT GCCAGTATTT ACATGGAAGA AAAATTAGAT GCTGTTGTTA CCATTGCGAC 
AAAAGGTATT TCATTGGCAA ATGCGGTTGC TAATATXTTA AATTTACCAG TAGTAGTGAT 
TAGAAAAGAC AACAAGGTGA CTGAAGGTTC TACAGTTTCA ATTAATTACG TTTCAGGATC 
TTCAAGAAAA ATAGAAACAA TGGTACTTTC GAAGAGAACT TTAGCAGAAA ATTCAAATGT 
TTTAGTTGTC GATGATTTTA TGAGGGCTGG TGGCTCTATT AATGGTGTTA TGAATTTAAT 
GAATGAGTTT AAAGCCCATG TAAAAGGGGT ATCAGTACTT GTAGAATCAA AAGAAGTTAA 
ACAAAGATTG ATTGAAGATT ATACTTCCTT AGTGAAATTA TCTGATGTAG ATGAATATAA 
TCaAGAGTTT AACGTAGAAC CTGGCAACAG TTTATCTAAG TTTTCATAAA AGGAGTTTTA 
GTATTATGAA AATCATTAAC ACAACAAQAT TACCGGAAGC ACTTGGACCA TATTCGCATG 
CAACAGTTGT GAATGGTATG GTTTATACTT CTOGTCAGAT TCCATTGAAT ATTGATGGAC 
ATATCGTAAG CGCTGATGTT CAAGCACAGA CAAAACAAGT TT7AGAAAAT TTAAAGGTTG 
TTTTGGAAGA AGCAGGATCT GATTTGAATT CTGTTGCGAA AGCGACCATT TTCATTAAAG 
ATATGAATX3A TTTCCAAAAA ATAAATGAAG TGTATGGTCA ATATTTTAAT GAACACAAGC 
CAGCGCGTAG TTGTGTAGAG GTTGCGCGTT TGCCAAAAGA TGTGAAAGTA GAAATTGAAT 
TAGTOAGTAA AATTAAGGAA TTATAATTTT CGATTAATAT GTTTAATCAA GCTTCTAAAT 
AAAACAGAGA GATATATACT ATAGGGGGGC TCACTACATG AAAGTGACAG ATGTAAGACT 
TAGAAAAATA CAAACAGATG GACGAATGAA AGCACTCGTT TCCATTACAT TAGATGAAGC 
TTTCGTAATT CATGATTTAC GTGTAATTGA AGGAAACTCT GGCTTGTTCG TTGCAATGCC 
AAGTAAACGT ACACCAGATG GTGAATTCCG CGACATCGcg CATCCTATTA ATTCAGATAT 
GAGACAAGAA ATTCAAGATG CAGTGATGAA AGTATATGAT GAAACAGATG AAGTAGTACC 
AGATAAAAAC GCTACATCAG AAGATTCAGA AGAAGCTTAA TCAATTTTAT ATTTAGCGAT 
GTAATACATT TGCAATAAGT TGATTTGATA CTGTCQATAA AGCATAAAGC TTTGTCGGCA 
GTTTTTTTAG TTTGTATTAA TGTTTTTTTA TTTTTAATGA AAGGCTAATA AATATATACG 
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TGaTGCTCGt ATTTTTGAAG TAAGAAAAAA GTTGTTTTTA AAATTACAAC GAATTAAAAA 
CAATGCCTTT TATATGTTGA AAGAGTATTG CaGATTAAAT TaTAATAATG ACGAaGgTAA 
AATTTAATGG GGGTTAATGT TCATGCX3AAG ACACGCGATA ATTTTGGCAG CAGGTAAAGG 
CACAAGAATG AAATCTAAAA AGTATAAAGT GCTACACGAG GTTGCTGGGA AACCTATGGT 
CGAACATGTA TTGGAAAGTG TGAAAGGCTC TGGTGTCGAT CA^GTTGTAA CCATCGTAGG 
ACATGGTGCT GAAAGTGTAA AAGGACATTT AGGCGAGCGT TCTTTATACA GTTTTCAAQA' 
GGAACAACTC GGTACTGCGC ATGCatGCAA ATGGCGAAAT CACACTTAGA AGACAAGGAA 
GGTACGACAA TCGTTGTATG TGGTGACACA CC6CTCATCA CAAAGGAAAC ATTAGTAACA 
TTGATTGCGC ATCACGAGGA TGCTAATGCT CAAGCAACTG TATTATCTGC ATCGATTCAA 
CAACCATATG GATACGGAA6 AATCGTTCGA AATGGGTCAG 6TCGTTTAGA ACGCATAGTT 
GAAGAGAAAG ATGCAACGCA AGCTGAAAAG GATATTAATG AAATTAGTTC AGGTATTTTT 
GCGTTTAATA ATAAAACGTT GTTTGAAAAA TTAACACAAG TGAAAAATGA TAATGCGCAA 
GGTGAATATT ACCTCCCTGa TGTATTGTCG TTAATTTTAA ATGATGGCGG CATCGTAGAA 
GTCTATCGTA CCAATGATGT TGAAGAAATC ATGGGTGTAA ATGATCGTGT AATGCTTAGT 
CAGGCTGAGA AGGCGATGCA ACGTCGTACG AATCATTATC ACATGCTAAA TGGTGTGACA 
ATCATCGATC CTGACAGCAC TTATATTGGT CCAGACGTTA CAATTGGTAG TGATACAGTC 
ATTGAACCAG GCGTACGAAT TAATGGTCGT ACAGAAATTG GCGAAGATGT TGTTATTGGT 
CAGTACTCTG AAATTAACAA TAGTACGATT GAAAATGGTG CATGTATTCA ACAGTCTGTT 
GTTAATGATG CTAGCGTAGG AGCGAATACT AAGGTCGGAC CGTTTGCGCA ATTGAGACCA 
GGCGCGCAAT TAGGTGCAGA TGTTAAGGTT GGAAATTTTG .TAGAAATTAA AAAAGCAGAT 
CTTAAAGATG GTGCCAAGGT TTCACATTTA AGTTATATTG GCGATGCTGr AATTGGCGAA 
CGTACTAAXA TTGGTTGCGG AACGATTACA GTTAACTATG ATGGTGAAAA TAAATTTAAA 
ACTATCGTCG GCAAAGATTC ATTTGTAGGT TGCAATGTTA ATTTAGTAGC ACCTGTAACA 
ATTGGTGATG ATGTATTGGT GGCAGCTGGT TCCACAATCA CAGATGACGT ACCAAATGAC 
AGTTTAGCTG TGGCAAGAGC AAGACAAACA ACAAAAGAAG GATATAGGAA ATAATCATTT 
ACGTATTTAA AATGGCTAGG ATAAAAGGAT AATCCTATGT AATATTAATG TAATCTTTAT 
GATTTAATGA TTCGCATAGT AATGGAGTTA CATyTTATAT ATAATAGTAA TTGCGTAAGT 
AAATAATTGG AGGACTATAA ATGTTAAATA ATGAATATAA GAATTCGTCA TTAAAGATTT 
TTTCATTGAA AGGAAACGAA GCATTAGCGC AAGAAGTTGC TGACCAAGTA GGAATTGAAC 
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AACCAACATC 


ATATCCTGTG 


AATCTACATT 


3€00 


GTAAACGTGC 


TTCTGCAGCA 


ACAATCAATA 


3660 


AAGATAGAAA 


AGCCCGTAGC 


CGTGAGCCAA 


3720 


AAAcAGCtGG 


CGCAACTCGT 


ATGATTGCGT 


3730 


TCTTTGATAT 


TCCAATTGAC 


CACTTAATGG 


3340 


ATGATCCGAA 


TATTAACCCA 


GAAGAATGTG 


3900 


ACX5TGCACGT 


AAATTAGCTG 


ACATTTTAAA 


3960 


TCCTAGACCA 


AATGTTGCTG 


AAGTGATGAA 


4020 


AATTATTATT 


GACGATATTA 


TTGATACAGC 


4030 


AAAAGATAAA 


GGTGCTAAAG 


AAGTATATGC 


4140 


GGCTAAAGAA 


CGTATCGAAA 


ATTCTGCTAT 


4200 


TTTAGATGAA 


GATCGCAAAC 


CATCTAACAC 


4260 


ACAAGCTATC 


ATTCGTGTAT 


ACGAAAGAGA 


4320 


AAAAGGCGTT 


TGACGAACAT 


ATTCCAAACG 


4330 


ATAAATAAAC 


ACTTGCAAGC 


AACGATGATG 


4440 


CAAAAATGAA 


AGGTGGAAAT 


GAGAATGGCT 


43UU 


CAAACACGTT 


CAGATCTTAA 


ACAATTAAGA 


4560 


GGTTACGGTA 


CTAAAAACGT 


GTCAGTTAAA 


4620 


CGTGAAGTAG 


GTCGTAACGG 


TGTTATCGAA 


4630 


ATGGTTGC 






4718 



(2) INFORMATION FOR SEQ ID NO: 300: 

(1) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3181 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : doxible 

(D) TOPOLOGY; linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 300: 

AAAATGCATA TAAATACATA TTAAGGAGGA TTTTATGAAT TTTCTTAAAC CTGCAAAGCA 60 

TATTAAGCCT TTGCCAGAAA ATCAGATAGA TGATACCTAT AAACGATTAC GTCTCCAAGT 120 

ATTTCTTGGT ATTTTCATCG GTTACGCTGG GTACTATTTA TTACGTAAAA ACXTTTCGTT 180 
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TGCTGTTTCC ATCGCATATG GATTTAGTAA GTTCTTTATG GGTACTGTAA gTGATCGGAG 300 

CAATGCTCGG ATATTCTTAG TTCTTGGATT AGCACTCACT GCTATCGTCA ATTTGTTAAT 360 

GGGATTTGTA CCGTTCTTTA CATCAGGTAT CGGTAtTATG TTTGTCCTAT TATTCTTAAA 420 

TGGATGGTTT CAAGGTATGG . GCTGGCCACC. TTCAGGCCGT GTTCTCGTTC ACTGGTTTAG 480 

TGTAAGTGAA CGCGGAAGTA AGACTGCCCT TTGGAACGTT GCGCATAATG TTGGTGGAGG 540 

TATTATGGCA CCTATTGCTG CTTGGGGTAT TACAACAACT GCATTTATCA ACTTTGGTTA 600 

TTTAAAAGGT TTCGAAGGTG TATTCATTTA CCCTGCACTC TTAGCACTTA TCATTGCCGC 660 

AATTTCATAC GTATTGATTA GAGACACACC TCTU^TCTCAA GGTTTACCTC CAATCGAAAT 720 

TTATAAAAAT GACTTTGCTA CAAGCGATAA GAAAACATTA GAAACAGAAT TAACTACAAA 780 

AGAAATTTTA TTTAAATATG TACTGAACAA TAAATGGGTA TGGGC3\ATTG CCTTTGCAAA 840 

TATATTTGTT TATTTCGTGC GTTATGGTGT ACTTGATTGG GCGCCAGTCT ACTTAAGTGA 900 

• ■ 

AGAAAAACAT TTCGACTTAA AAGCATCAGG TTGGGCATAC TTCTTATACG AATGGGCTGG 960 

AATTCCTGGT ACATTATTAT GTGGTTACAT TTCTGATAAA TTATTCAAAG GTCGTCGTGG 1020 

2$ ACCTGCAGGT TTCTTCTTTA TGTTAOGTGT CACAGTATTT GTATTAATTT ATTGGTTAAA 1080 

• ■ ' 

TCCTCCAGGC AATGCTTGGT TAGACAATGT CTCATTAATT GCCATTGGTT TCTTAATATA 1140 

TGGACCAGTT ATGTTAATTG GTTTACAAGC ATTAGATTAT GTACCTAAAA AAGCAGCTGG 1200 

CACAgcAGCT GGATTAACAG GATTATTTGG TTATCTGTTT GGTGCTGTAA TGGCCAACAT • 1260 

CGTCTTAGGT GCTGTAGTTG ATAAATTCGG ATGGGATGTC GGTTTTATTT TATTAACAGC 1320 

AATTAGTGTG TTTGCAATGT TGAGCTTTAT CCTCACTTGG AATAAAGTAG GACAAGAAAC 1380 

CGTTCATCAT TAAATGATAA AAAATAAAGT CATATGGTTA TCTTATCGAA AGATGATATA 1440 

TTCflTCTCTT ATAAGTTCAA CCATATGACT TTTTATTAGT ATTCAAAAAA ATATTTACAT 1500' 

TGCCACTTTT GTGTTTGCCC TGCTGTTTTA TTCAATTGAT TACACCACTT AGGATAAACT 1560 

CTAAAAGCCA TTTTCCCTTG ATACTTAGAT GAAGCTAAGA TACCTTTTTC TACCAATAAT 1620 

TCCCTAGGAA ATAGAAAGTA GCCATTTAAT TCATCATCGA TAACAGCAAC AATCAGGTAA 1680 

TCAGCAAACT CTTCAATTTT GTATGGCCGA, TTATAATTAT CtTCGTCTTT TGTCCAACAT 174 0 

GTCACGAAAT ATCCCGATTT AGTCGGTGTT TTCTTAGCTA ACCTACTTTG ATATGTTTCC 1800 

TCTTTAAAGC TAAATGTTAA TGCyTCGTAA TCTTGATTAT ATTTTTCTTC AGTTAAATCT 1860 

SO TTAACTTCTG ATTCTTCACT AAAAATATTT TTCAACAGTA TTTTAGATTT ACACATATGC 1920 

CAATCTCACT TTATTTTTTC ATAATCGTAT CATATATTTA TTTTTTTCGA AAAATACACT 1980 
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TGTATCAACT GTCAAACGAT CACGTAATAA ATAGACGATT AACATTGcTG CTAAAGCACA 
AAGTGACTCA GCAATTAATA ATGACCAAAT GACACCTGTT AGTCCAAACA AAGCATTCAT 
AATAAATAAT ACTGGAATGA TAATTGCACC TTGTAAAATG GCCATAATTG TAGCACCACG 
ACCTTGCCCA GTCGCTTGAA GCATACCAGT AAACAAGAAA CCTATACCAT TTAATAATAA 
TGATGCCATT GTTACTTTCA AAATAAATGt CGCCATCTCA ACAATGGCTT GATCAGTAGT 
AAATAGTCCG ACCATATGAT GTCCAATTGT AAATACAGCA CTCATACATA CAACAAAGAT 
AACGCCGATA GACATGATAA CTGCTTTGAT AACGTCTTTC ATACGGCCTT TATTTGCCAT 
AAAGTTATAT GCAATTAGTG GTACAACACC TTCACATAAT CCCATGATAA TAAGTTCTGG 
aAATTGCACA AGTCTAAATG AGATACCATA ACTTGCaATC GCGAAGTTTC CATAATGTGC 
TAAAAATAAA TTTAAAACTA ATCCTGTGAA TCCCATTAAG ATACTCATTA AAAATGCAGG 
AATACCGATT TTAAAGATTT CAGAAAGCAT TTCTITATTA GGTTTCGCAA GTTTAATATT 
AACTGACACA ACGTCACTAT ITiTCATAAA ATAAATGATA AAGAACAGAG CAGCAGCAAC 
ATTACTGATT GCAGTACCCA AAGCTGcACC AACAACGTTT aAATCAAAAC CAAAAATTAA 
AATTGGATCT AAAATAATAT TTAAGCCTAC ACTAGCTAAC ATACCAATCA TAGAAACCAT 
TGGTGCCCCA ATTGCACGTG CAAATTGTTC TAATATGAAG AACAAAATTA CAAAAGGTGC 
ACTTAAAAAC ATTACTTTCA AATAATTACT TGTTAAAGCT AACGTTTCAC CTCTCGCCCC 
TAAAATTGCT GCGATTTGAT CACTGAATGG TAAAGTAACT AAAATCACGA TAAGTCCTAG 
TGCAATACCA CCATAAATAG AGAAACTACT TACAAATTTA CTCTTAmTAT AGTCTTTCX5C 

■ ■ * 

» * 

ACCTAATAAA CGTGAAATAT AAGTTCCTGC ACCAACGCCA AATAAATTAC CTAACCCCAT 
T 

(2) IlNFORMATION FOR SEQ ID NO: 301: 

(i) SEQUENCE CHARACTERISTICS: 

<A) LENGTH: 4029 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 301: 
TCATCACCTT CAAATAAATA GGCATGCGAT AATTTATTTG AATGATATGC ATTCGTCAAT 
TGTTGCTGTT CATCCATTCA TTACAAACTC CCTTTTGCTT TTATATAAAA AGGTTGCCAA 
AGAGCAACTA ATTACTGCAA CAATAGCGAC CATGATTTGT GATTATTTTT AGAACCACAA 
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TTATTAATAC ACTATTTTAA GTATCTCTAA TTGSATGATTG TATTATAGAA TTAAAATTGA 
TGGAATGCAT CAACTGGCAT AACAAATACA GTAGCACCGC CAACXTCAAC TTCAACTGGA 
TATGGAATGT ACGAATCCXSC ACTGCCTCCC ATAGGTGTAA TAGGTGAAAC CAACTGTTCT 
CTATTACCAC ACGTTTGATT AATCACAGAC AATATTTCAT CTACACGGTC ATCATTGACA 
CCACATAAGA ATGTTGTATT ACCCGCTCTT AAAAACCCAC CTGTTGTTGC CAATTTTGTT 
GCTCTAAAGT TATTTTTAAC AAGTTGATCT GCAAGTTCCT GACTATCTTG ATCTTGTACG 
ATCGCTATAA TCATTTTCAT TTTATAACAC CTCTTCTAAC AATTATATCA TATCTTTTCT 
AAATATTTGA TGATAGTTTG ATACGTGTCT TCAACAACAT TTTCAAGAGG TTGATCTGCA 
TTAACGCTTT TGAACCXnTG TGATTCATTA TGAATGATTT CTTGGTAACC TTCAATTACT 
TTTTCGTGAA cTTTAAATCT TCTTGATCTA ATCTATTTTQ ATCTCTTGAA TTTTTAATAA 
TACGTTCGCG ACCTACTTCA GCACTAACAT TTAAATAAAT CGTCAAGTCT GGaTATAATC 
CATTTATTGC AAATTCGTrT AATGCTCTTA CTTCTTCAAC GCCAATCCCT CTAGCATAAC 
CTTGATAAGC TAATGAACTA TCGATATAGC GATCACACAA CACAACCTTA CCTTCTTTTA 
AAGCTGGTAT GACCTTTAAT ACAAGATGTT CTCTTCTAGA TGCAGCAAAT AACATTGcTT 
CaGTtCTAAT GTCCATATCA TTGCCcTTCT AATACAATTT TACGTATTTC TTCACCAGTA 
GGAACACCAC CTGGTTCTCT AGTCATAATG ACATCATAAT CTTTTACTAA TCTATGGTAA 
ACTTCATTAA. TTACAGTTGT. TrTTCCAGAG CCTTCTGGGC CCTCAAAAGT TATAAAAGCT 
GAGATTTTAT TCATCCTCAA CTAAAATTTT ATTATTTTTA ATTCCTTCAA CTATCATTCC 
AGTTTCCAGA TATTCATTTA CCAATTCTAT CATATTTTCA GTTATTGTTT CTCCTTTGAA 
AATAATAGGA ATcCCTGGcG GATACGGGAC AATATGTCGC GCCAGAACTT TACCTTTgCC 
TTTTcAAATC ACACCAAGTA ACATATTCAA AGCGTTTTGG TTTATAGTrA CCTTCAGTyG 
TTAAAAGTTG TGTTTGTTTA ACTTTAGAAA CTGATTTTTT CGGTAAAATC ATATCTTCAA 
TTTTACGTAA AAGCGAATCA AATAAATACG TATCATCATG ATGCCATAAC GGCAATATCG 

- — ^ -r . •> ' * 

CTAATGCTTG ATAGTCGTCC GCTAATTCTA AATAGATATG TGCATTCATA AACCAATTTT 
GAATATCATG ACCTGTAAAA CCTTCATATT TTATCAGCAA CTTCAACX;GA TCATCAACTT 
GAAGCATTTC AAAACCCTTC TTCTCCAAAC ATTCGATTAA TTGCGCTCTC TTATCAAAAA 
ACACGGTACT ATCATATGTT TTATAGAACT CGGCAGCTGA CTCTAAACTA GCCATAATCA 
AATACGAAGG ACTAGATGTT TGGAAGTAGC TTAGATATTC TATAATAGTT TCTCTATAAG 
GTGCATTTTT ATGAATATAA AGTACCGAGC CCATCGTTAA AGCTGGTAAC GTTTTATGAA 



300 
360 
420 
480 
540 
600 
660 
720 
780 
840 
900 
950 
1020 
1080 
1140 
1200 
X260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 
1920 
1980 
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CAAAGTGCGC GCCGTGTGCT TCGTCAATGA GTACAGGAAT ATTTAATTGG TGCAAAGATT 2100 

TGATAACCTC TTCTACATTA AATGTTTCAC CGTAATAGTT AGGATAAGTC AACACAGCAA 2160 

GI-TTGTGACC GTCATTATTC AAACGGCTTA AATTAACTTT ATTATAATGA TTCGTTAACG 2220 

GACTTTGATG CGTTTCAATA AAATGCCCTT CTTGTTGGCT AATATCGAGC GCATGTAACA 2280 

CAGATTTATG TACATTTCTT GCCATTAAGA TATCGCCTTT TTTCTGTGAA AAAGACTGGA 2340 

TGACAGATAA TATTCCTGAA GTGGTGCCAT TCACTAAGAA ATAAGCATCA TAATCTGAAT 2400 

GTTTCTCCAC CTGCTTCATA CTTTCCAAAA TGACTTCTTC AGGATGATGT AAATCAnCTn 2460 

AATCCAGGTA TTTCAGTTTT ATCCATTGTC ATTGATAATT GAGATAAATG ACCGATAGTC 2520 

ATATTTTTAT GACCCGGAAC ATGCAAAGAA ATCGCTTCTT CTTGATTTAA ACTTTCTAAT 2580 

■ TTATTTAAAA TAGGTTGCTT CATGATATAC GCTTCCTTTA TTTACACTGT TTTGGAATTA 2640 

20 GTTACTTTCA AAAGTATTAA TTATATAGTA ACACTTCTTT GACAAAAGTT AGTGTTACTT 2700 

ATGCAATAGC TTGTCTATTG TATAATAATT AATTTCCTTT TTGTACTTCG ATTTAAAAGA 2760 

TATTAGACAT AAAATCTAAA AACAGCAGTA AGATGATTTA TGATTAAAAA CTATCTTACT 2820 

2S GCTGTTCACT TTTTATAATA CTTCTGAATG TCTTCACTTA ♦ TACTTCTAGT CACAGATTTA 2880 

< . • ■ - . 

AATAATCAAA AGTGCACATT ATTAAAATAT CAATTTCACA CTCAATGCGG CTCATCGCAT 2940 

TCATTTCTTG TCTAGCAACG TTCTACTCTA GCGGAACGTA AGTTAGCTAC CATCCTCGCT 3000 

AAGAACCTTT CTTGACTTGT GACAATCGCT ' TGCTTCTTTC CTCTCCTTCG GCTCTCGCTT 3060 

ACTCATTTAG CTCTACTAAA CTCGTTGCGC TCTTTTCTCG TTTCGTCAGA TTCAAACGTT 3120 

TTCACTTCGC CAAGCCATTT TTCTTTGTGT TTACnTTTA TTTTGACGTT TTAGACATAA 3180 

.AAAAAGAGAC cTCACGGTCT. CAACTTGCCT GGCAACGTTC TACTCTAGCG GAACGTAAGT 3240 

TGGCTACCAT CGTCGCTAAA GACCTTTCTT GACTTGTGAC AATCGCTTGC TTCTTTCCTC 3300 

TCCTTCGGCT CTCGCTTACT CATTTAGCTC TACTAAACTC GTTGCGCTCT TTTCTCGTTT 3360 

CGTCAGATTC AAACGTTTTC ACTTCX5CCAA GCCATTTTTC TTTGTGTTTA CTTTTTATTT 3420 

TGAOSTTTTA GrCATAAAAA AAAGAGACcT TGCGGTCTCA ATGCGGCTCA TCGCATCCAT 3480 

45 TTTTTGCCTG GCAACGTTCT ACTCTAGCGG AACGTAAGTT GGCTACCATC GwCGCTAAgA 3540 

aCCTTTCTTG ACTTGTGACA ATCGCTTGCT TCTTTCCTCT yCTTCGGCTC TCGCTTACTC 3600 

ATTTAGCTCT ACTAAACTCG TTGCGCTCTT TTCTCGTTTC GTCAGATTCA AACGTTTTCA 3660 

SO CTTCGCCAAG CCATTTTTCT TTGTGTTTGC TTTTTATTTT GACGTTTTAG ACATAAAAAA 3720 

AAGAGACCTT GCGGTCTCAA TGCGGCTCAT CGCATCCATT TTTTGCCTGG CAACGTTCTA 3780 
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CATGGGAACA GGTGTGACCT CCTTGCTATA GTCACCAGAC ATATGAATGT AATTTATACA 
TTCAAAACTA GATAGTAAGT gAAAAGTGGA TTTTGCTTCG CAAAACATTT ATTTTGGATT 
AAGTCTTCGA TCGATTAGTG ATTCGTGCAG CTCCACATGT GCACCATGCT TGCCACCTCG 
GAACCTATT 

(2) INFORMATION FOR SEQ ID NO: 302: 

■ 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 7159 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(Xi> SEQUENCE DESCRIPTION: SEQ ID NO: 302: 
GATGCAATAG TTGAGTAGTT ATAAGTAGCT ACATACAACC GCTCAAATAT AGGTTCAAGA 
ACATTTTTAA TGAAGAAAGC GATTTTCCCltl CAGAGTGCAA ACGCTTGACT CAATAACGAA 
ATGTCACCTA TGTATGGCGT GACTTATTAT ACAGGaGGTG CAAAGTATGT TTGCTATTAT 
TGAAACAGGT GGAAAACAAA TCAAAGTAGA AGAAGGTCAA GAAATCTTCG TTGAAAAATT 
AGACGTAAAC GAAGGAGATA CTTTTACATT TGATAAAGTA TTATTTGTAG GTGGAGATTC 
AGTTAAAGTT GGAGCGCCAA CAGTTGAAGG TGOVACAGTT ACTGCTACTG TTAATAAACA 
AGGTCGCGGT AAAAAAATCA CTGTATTOVC ATACAAACGT CGTAAAAATT CAAAACGTAA 
AAAAGGCCAT CGTCAACCAT ACACTAAATT AACAATCGAT AAAATCAACG CGTAATTATT 
ATGATTACTG TTGATATTAC AGTTAATGAT GAAGGCAAAG TAACAGACGT TATTATGGAT 
GGCCATGCTG aCCATGGTGa ATATGGTCAT GATATCGTTT GTGCTGGAGC TTCAgCTGTA 
TTCKTOGTA GTGTTAATGC GATTATAGGA TTGACATCTG AGAGACCAGA TATCAATTAT 

m 

GACGACAAT6 GTGGTCATTT TCATATAAGA AGCGTTGATA CAAACAACGA TGAAGCGCAA 
CTAATTCTTC AAACAATGCT TGTGTCTTTA CAAACTATTG AAGAAGAATA TAATGAGAAT 
ATTAGATTAA ATTATAAGTG AGGTGCATTC CGAT6TTAAA ATTAAACTTA CAATTCTTCG 
CATCTAAAAA AGGGGTAAGT TCTACAAAAA ACGGACGTGA CTCTGAATCA AAACGCTTAG 
GTGCTAAACG TGCTGACGGT CAATTCGTAA CAGGTGGTTC AATTTTATAT CGCCAACGTG 
GTACTAAAAT TTACCCTGGT GAAAATGTAG GTCGTGGTGG CGATGATACA TTATTCGCTA 
AAATCGACGG CGTTGTTAAA TTCGAACGTA AAGGTCGCGA CAAAAAACAA GTTTCTGTAT 
ATGCAGTAGC TGAATAATTT TGTCTAGTTA ACACCAGAAG TGAATCTTCT GGTGTTtTTT 
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AGACGTTATA CTAAATGTGC AcTGTATAAG AGCCCCTAAT CACTAAACTA TAAGGGGGAC 1260 

AAAGGAATAC AGTTGCAGCG TTTAAAGAAT AAACTGTACC ACAATTGGTG CTGAGAAATA 1320 

TAAGTATTTT AAAGCAAAGA TTTATAAAAG TAACTGCATA AGAGCCCCTA ATTATTTACA 1380 

ATATATAAGG GGCTCTAATA TGCTATAATT ATTGGGAAAA TGAAAATTAT ATGTAAAAGA 1440 

GGTGAGATAT ATGTTTGTCG ATCAAGTCAA AATATCTCTT AAAGCCGGTG ATGGTGGTAA 1500 

TGGTATTACC GCAtACAGAA GAGAAAAATA TGTACCATTT GGTGGACCAG CTGGCGGTGA 1560 

CGGTGGTAAA GGTGCTTCAG TCGTATTTGA AGTGGATGAA GGTTTAAGAA CGTTATTAGA 1620 

TTTTAGATAT CAACGTCATT TTAAAGCAAG CAAAGGTQAA AATGGCCAAA GTAGTAATAT 1680 

GCATGGTAAA AATGCGGAAG ATTTAGTATT AAAAGTTCCA CCTGGTACAA TTATTAAAAA . 1740 

TGTTGAAACA GACGAAgTGT TAGCAGATCT TGTTGAAGAT GGTCAAAGAG CTGTAGTAGC 1800 

20 GAAGGGCGGT CGAGGTGGCC GAGGTAATTC ACGTrTTGCA ACACCTAGAA ACCCTGCACC 1860 

TGACTTCAGT GAAAAAGGTG AACCAGGTGA GGAATTAGAT GTATCTTTAG AATTGAAATT 1920 

ATTAGCTGAT GTAGGATTAG TAGGTTTCCC TAGTGTGGGT AAATCGACTT TATTATCTAT 1980 

CGTTTCAAAA GCTAAGCCTA AAATTGGGGC ATATCATTTT ACAACGATTA AACCAAATCT 2040 

AGGTGTTGTT TCAAOGCCTG ATCAACGTAG TTTTGTTATG GCAGATTTAC CAGGTTTAAT 2100 

TGAAGGTGCA TCTGATGGCG TTGGATTAGG ACATCAATTT TTAAGACATG TAGAGAGAAC 2160 

AAAAGTTATT GTTCACATGA TTGATATGAG CGGTTCTGAA GGTAGAGAAC CTATTGAAGA 2220 

TTATAAAGTC ATTAATCAAG AATTAGCTGC GTACGAGCAA CGTTTAGAAG ATAGACCTCA 2280 

AATCGTAGTA GCTAACAAGA TGGATTTACC TGAATCACAA GATAATTTAA ACTTGTTTAA 2340 

. AGAAGAAATT GGC3GAAGATG TGCCAGTTAT TCCAGTTTCA ACAATAACGC GTGATAATAT 2400 

TGA'TCAATTA TTATATGCAA TAGCAGATAA ATTAGAAGAA TATAAAGATG TTGACTTCAC 2460 

AGTTGAAGAA GAGGAGTCAG TTGGCATTAA CCGAGTATTA TATAAACATA CACCGTCACA 2520 
AGATAAATTT ACAATTTCAA GAGATGATGA TGGTGCTTAT GTGGTAAGTG GTAATGCTAT . . 2580 

TGAAAGAATG TTTAAAATGA CTGACTTTAA CAGTGATCCA GCAGTACGTC GATTTGCTCG 2640 
45 .. . . TCAAATGCGT TCGATGGGTA TTGATGATGC GCTTAGAGAA CGTGGTTGTA AAAATGGTGA . 2700 

TATCGTTAGA ATTCTTGGCG GAGAATTTGA ATTCGTTGAA TAGGAGCGAA ACATGATGGA 2760 

CAATAAAGAT TATAAAAAGT TTTATTTAAT TAGAGAAGAT GTCTTGCCTG AATCCGTGGT 2820 

TAAAACATTG AAOATTAAAG ATGCCTTAAA AAGTGATCCG ACATTGTCCA TTTATGATGC 2880 

CGTTAAACAG TTTGATCTAT CTAGAAGTGC TTTTTATAAA TATAGAGAAA CGATATTTCC 2940 
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TGTTGGTATG TTGGCACGTG TACTAGATGT TATATCAAAG TTAGAACTAT CTGTATTAAC 30S0 

GATTCATCAA AGTATTCCAA TGGAAGAAAA AGCAACAATA ACATTATCAC TGAATGCTAA 3120 

ATCTAAAGAA ACTTCAGTAG AAGATGTTAT TGGCGCTTTG AGAAATTTAG ATTATGTATC 3180 

AAAAGTAGAA TTAATTAGTA TGAGTATGTA AGGATGTGCC TATAATGTAC GCGTATGTCA 3240 

AAGGTAAGTT AACACATTTA TATCCTACAC ACGTAGTTGT TGAAACTGCT GGTGTTGGTT 3300 

ATGAAATTCA AACACCAAAT TCTTATCGTT TTCAAAAGCA TCTAGATCAT GAAGTTTTAA 3360 

TTCATACATC TTTAATTGTT CGTGAAGATG CACAATTATT GTATGGATTT AGTAGTGAAG 3420 

AAGAGAAAGA TATGrTCTTG AGTTTAATTA AAGTTACTGG TATTGGTCCG AAATCAGCTT 3430 

TAGCTATTTT AGCGACAAGT ACGCCTAATG AAGTAAAACG TGCCATTGAA AATGAAAATG 3540 

ATACGTATTT AACTAAATTC CCAGGAATTG GTAAGAAAAC GGCAAGACAG ATTGTCTTAG 3600 

20 ATTTAAAAGG TAAAGTGAAA ATTACTGAAG AAGATAGCGA TTCATTATTA CAAGTAGACG 3660 

CTACTTCGAC GGTGCAAGAT CAATTCGTGC AAGAAGCAAT GTTAGCGTTA GAAGCATTAG 3720 

GTTATTCTAA ACGAGAGCTT GCAAAAGTIG AGAAAACGTT AAATAAAAAT AAATATGACT 3780 

CAGTTGATGA AGCTGTTAAG GCAGGTCTTC AATTAGTTGT ATCTTAATTT TAAATAGATT 3840 

AATAGGGGAA GTGTT6TCAT GAATGAGCGT ATGGTTGATC AATCAATGCA TAGTGAAGAA 3900 

ACTGATTTCG AATTGTCXJCT TAGACCTACG AGATTACGAC AATATATTGG TCAAAATTCA 3960 

ATAAAAAGTA ATTTAGAAGT ATTTATTAAA GCGGCTAAAC TTCGTCATGA ACCATTAGAT 4020 

CATGTATTGC TTTTTGGCCC CCCTGGATTA GGTAAGACAA CATTATCTAA TATCATTGCC 4080 

AATGAAATGG AAGTTAATAT ACGTACAGTA TCAGGGCCTT CATTAGAAAG ACCTGGTGAT 4140 

TTGGCTGCAA TTTTATCAGG ACTTCAACCT GGAGATGTTT TGTTTATTGA TGAAATACAC 4200 

AGACTGAGTA GTGTTGTTGA AGAAGTGTTA TACCCTGCAA TGGAAOATTT CTTTTTAGAT 4260 

ATTATCATTG GTAAAGGCGA TGAGGCTAGA AGTATCCGTA TCGACTTACC TCCATTCACT 4320 

TTGGTAGGTO CAACAACGCG AGCTGGCAGC TTAACAGGTC CACTAAGGGA TCGATTTGGT 4380 

GTGCACTTAA GATTAGAATA TTATAACGAA TCAGATTTAA AAGAAATCAT TATTAGAACA 4440 

45 GCTGAGGTTT TAGGCACAGG TATTGATGAA GAAAGTGCCA TTGAACTTGC TAAACGTTCT 4500 

AGAGGGACTC CAAGAGTAGC AAATCGACTA TTGAAGCGGG XAAGAGACTT CCAGCAAGTG 4560 

AATGAAGATG AACAAATATA CATTGAAACA ACGAAGCACG CATTAGGTTT ACTTCAAGTT 4620 

GATCAACACG GACTAGATTA CATTGATCAT AAAATOATGA ACTGTATTAT TAAGCAGTAT 4680 

AATGGCGGAC CTGTTGGTTT AGATACXIATT GCCGTAACAA TTGGTGAAGA ACGTATTACA 4740 



30 



35 



40 



55 



1135 



EP0 786 519 A2 

GGCAGAAAAG CAACACCATT AGCTTATGAA CATTTTGCAA AGTCGAATGA GGAGAGAGAA 4860 

TAACGTGAAT ATTGAAGAAT TTGACTATGA CTTACCAGAA TCATTAATTG CTCAAACGCC 4920 

5 

TTTAAAAGAT CGTGATCATA GTCGTTTATT AGTCATGGAT AGAGAAACTG GTGAAATGAA 4980 

ACATTTACAT TTCAAAGATA TCATTGAGTA TTTTAGACCT GGTGATACAT TAGTGCTTAA 5040 

CGATACGCGA GTAATGCCAG CTAGACTTTT TGGTTTAAAA GAAGAAACTG GTGCAAAAGT 5100 

10 

TGAAATGTTA ATGTtAACTC AAATTGAAGG TAATGATTGG GAAGTCTTAC TGAAACCAGC 5160 

TAAGCGTATT AAAGTTGGTA ATAAATTGAA TTTTGGTAAT GGCAAAATTA TAGCTGAATG 5220 

^5 CATAAAAGAA ATGGATCAAG GTGGACGCAT CATGCGTTTA CATTATGAAG GTATTTTACA 5280 

AGAAAGATTA GATGAATTAG GGGAAATGCC ACTGCCACCA TACATCAAAG AACGTTTAGA 5340 

TGATCCAGAT CGTTATCAAA CAGTTTACGC TAAAGAAAGT GGTTCAGCGG CAGCACCAAC 5400 

20 AGCAGGATTA CATTTTACTG ATGAGTTATT AATTGAAATT AAAAATAAAG GTGTTAATAT 5460 

OGCATTTGTT ACATTACATG TTGGGTTAGG TACGTTTAGA CCGGTGAGCG TAGACGATGT 5520 

GAATGACCAC GAAATGCATA GTGAATATTA TCAAATGACm CAAGAAACAG CTGATTTATT 5580 

' AAATGATACT AAGcCAAAGG ACATCXSCATT ATATCAGTTG GTACAACTTC AACACGTACA 5640 

CTTGAAACAA TTCGACGCGA TCATGATAAA TTTGTTGAAA CGAGTGGCTG GACTAATATA 5700 

TTTATTTATC CAGGATTTGA TTTTAAAGCA ATTGATGGCC AGATTACTAA TTTTCATTTA 5760 

30 

CCAAAATCAA CATTAGTTAT GCTAGTATCA GCGTTTAGTA GTCGTGAAAA TGTTCTGAAT 5820 ' 

GCTTATAAAA CGGCAGTAAA TTTAGAATAT AGATTCTTTA GTTTTGGCGA TGCAATGTTA 5830 

ATTATATAAA AAGAATGTGA GGATTTTGAA TATGCCTGCA GTAACATACG AACACATTAA 5940 

35 ' ' ' ■ 

AACTTGTAAA CAATCAGGTG CGCGTTTAGG TATCGTGCAC ACACCACACG GTTCATTTGA 6000 

AACACCTATG TTTATGCCAG TTGGTACTAA AGCAACGGTT AAAACAATGA GTCCAGAAGA 6060 

GTTAAGACAA ATTGAAGCAA AAATCATTTT GQGCAACACA TATCATTTGT GGTTACAACC 6120 

CGGAAATGAT ATTATCAAAC ACGCTGGGGG ATTACATAAA TTCATGAATT GGGATGGTCC .6180 

GATTCTTACA GATTCAGGCG GTTTCCAAGT GTTTAGTTTA AGTAATTTAC GTAAAATTAC 6240 

45 AGAAGAAGGC GTGGAATTTA GACATCATAC TAATGGGTCT AAATTATTTT . TGAGTCCTGA 6300 

GAAATCAATG CAAATTCAAA ATGATTTAGG ATCTGATATT ATGATGGCAT TTGATGAATG 6360 

TCCACCGATG CCTGCTGAAT ATGATTATGT AAAAAAATCT ATTGAACGTA CAACACGTTG 6420 

GGCGAAAAGA TGTCTAGATG CACACCAAAG ACCTGAAGAT CAAGCATTGT TCGGCATTAT 6480 

ACAAGGTGGC GAATATGAAG ATTTAAGAGA ACAAAGTGCA AAGGATTTAG TAGAATTAGA 6540 

55 
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AATGGTTGAA CATACAGAGC AGTTTATGCC TAAAGATAAA CCAAGATATT TAATGGGTGT 
AGGATCTCCa GATGCGTTAA TCGAATGTAG TATTCGCX^GC ATGGATATGT TTGATTGTGT 
CTTACCGACA CGTATTGCCA. GAAATGGTAC TTGTATGACA TCGCAAGGTC GTTTAGTTAT 
TAAAAATGCA AAATTTGCAG ATGATTTAAG ACCGTTAGAT GAGAATTGTG ACTGTTATAC 
ATGTCAAAAC TATTCAAGAG CGTATATACG TCATTTAATC AAGGCAGAGG AAACTTTTGG 
TATTCGTCTT ACTACTArTC ATAATTTACA TTTTCTGCTA AAATTAATGG AAGATATAAG 
ACAAGCCATT CGAGAAGATC GTCTTTTAGA TTTCAAAGAA GAATTCTTCG AGCAATATGG 
ATTAAATGTT GAGAACCCAA AAAACTTTTA AGCAAGAGGA GCGTATAAAA TGCAATTTTC 
ATTACTAATA TATATAGTCG TAATTTTTGC GGTTATGTAT TTCTTGATGA TCAGACCACA 
ACAAAAACTG TGCGAAACA 
(2) INFORMATION FOR SEQ ID NO: 303: 

(i) SEQUENCE CKARACTSRISTICS : 

(A) LENGTH: 3159 base pairs ' 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS; double , . . 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 303: 
TCCATTTATA GAAATTTCTA AAGCAGAnAA TAAGATAGAA GATATCGGCC AAGGTGCAGA 
AATCATCAAA AGAACACAAG ACATTACTAG CAAACGATTA GCTATAACTC AAAACATTCA 
ATTTGATTTT GTAAAAGATA AAAAATATAA CAAAGATGCC CTAGTTGTTA AGATGCAAGG 
CTTCATTAGC TCTAGAaCAA CATATTCAGA CTTAAAAAAA TATCCATATA TTAAAAGAAT 
GATATGGCCA TTTCAATATA ATATCAGTTT GArAACGAAA GACTCTAATG TTGATTTAAT 
TAATTATCTT CCTAAAAATA rAATTGATTC AGCAGATGTT AGTCAGAAAT TAGGCTATAA 
TATCGGCGGA AACTTCCAAT CAGOGCCATC AATCGGAGGC AGTGGCTCAT TCAACTACTC 
TAAAACAATT AGTTATAATC AAAAAAACTA TGTTACTGAA GTAGAAAGTC AGAACTCTAA 
AGGTGTTAAA TGGGGAGTGA AAGCAAATTC ATTCGTTACA CCGAATGGTC AAGTATCTGC 
ATATGATCAA TACTTATTTG CACAAGACCC AACTGGTCCA GCAGCACGAG ACTATTTCGT 
CCCAGATAAT CAACTACCTC CTTTAATTCA AAGTGGCTTT AATCCATCAT TTATTACAAC 
ATTGTCACAC GAAAGAGGTA AAGGTGATAA AAGCGAGTTT GAAATcACTT ACGGCAGAAA 
CATGGATGCr ACATATGCTT ACGTGACAAG ACATCGTTTA GCCGTTGATA GAAAACATGA 
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AAAAATTAAA AGCATCACAC CTAAGTAAAC AGTTCaATCA TCTTAAAAAA TCCTGGGACA 900 

CTTCATACTT GTCTCAGGAT TTTTTmACAA ATTGAATCAG CCTCATAACA TTAAATTATT 960 

TTATCGTACA TTAAATTTAA TAATAACAAC TGATTTTTAT AAGAATAAAG TATCGAmCCA 1020 

TAGTAGATAC ACAAATAATA CAAATGAAAC AATTTAACTT GAAAGCTTAa ATAAATATTA 1080 

TCAAGTTAAT AAACAATTAA TTTTTAGATG GATTCATCAA AAATCGTAAA AAAGCACAAT 1140 

TTGTATTTTA CAAACATTAA TTAAAAAAGA AAGCAAGACA TTCGTGCAAT CGGTTACCTT 1200 

AAATTGTTTA CAACTGTCAA CAATACCAAG GTTTTATTAA CTATATTTCT CACAAAATTA 1260 

GCTTTTAGCA TTCCAAACAA AAAAGGTTAA ATCGAACXjGA ATTATGGCAT TTTTAACTTA 1320 

- . * - - 

ATTGTAAAAA AAGTTGATAA TGGTCAATTG TTAATGAACA GTTAATTATA ATAACGCCCA 1380 

AAATATATTA TTATTTAATT AAGTTAAATA AAATTATAGA AAGAAAGTGA AACTIATGCT 1440 

TAAAAATAAA ATATTAACTA CAACTTTATC TGTGAGCTTA CTTGCCCCTC TTGCCAATCC 1500 

GTTATTAGAA AATGctAAAG CTGCTAAOGA TACTGAAGAC ATCGGTAAAG GAAGCGATAT 1560 

AGAAATTATC AAAAGGACAG AAGATAAAAC AAGTAATAAA TGGGGCGTGA CTCAAAATAT 1620 

TCAATTTGAT TTTGTAAAGG ATAAAAAATA TAACAAAGAT GCTTTGATAT TAAAGATGCA 1680 

AGGATTCATT AGCTCTAGAA CAACATATTA CAACTATAAA AAAACTAATC ATGTTAAAGC 1740 

TATGCGATGG CCATTCCAAT aTaATATTGG TTTAAAAACA AATGATAAAT ATGTTTCTTT 1800 

AATTAATTAT TTACCTAAAA ATAAAATTGA ATCTACAAAC GTGAGTCAGA CATTAGGATA 1860 

CAATATCGGT GGTAATTTCC AATCAGCCCC ATCACTCGGT GGTAATGGAT CATTTAACTA .1920 

TTCTAAATCG ATTAGCTATA CACAACAAAA TTATGTAAGT GAAGTAGAAC AACAAAACTC 1980 

AAAAAGTGTT TTATGGGGCG TCAAAGCGAA TTCATTCGCC ACTGAATCAG GTCAAAAATC 2040 

AGCCTTTGAT AGCGATTTAT TTGTAGGCTA CAAACCTCAT AGTAAAGATC CTAGAGATTA 2100 

TTTCGTTCCA GACAGTGAGT TACCACCTCT TGTACAAAGT GGATTTAACC CTTCATTTAT 2160 

CGCCACAGTA TCTCATGAAA AAGGTTCAAG CGATACAAGC GAATTTGAAA TTACTTACGG 2220' 

AAGAAACATG GATGTCACTC ATGCCATTAA AAGATCAACG CATTATGGCA ACAGTTATTT 2280 

AGACGGACAT AGAGTCCATA ATGCATTTGT AAATAGAAAC TATACTGTGA AATACGAGGT 2340 

CAATTGGAAG ACTCATGAAA TCAAGGTGAA AGGACAGAAT TGATATGAAA ATGAATAAAT 2400 

TAGTCAAATC ATCCGTTGCT ACATCTATGG CATTArTATT ACTTTCTGGT ACTGCTAATG 2460 

CTGAAGGTAA AATAACACCA GTCAGCGTAA AAAAAGTCX3A TGACAAAGTT ACTTTATACA 2520 

AAACAACAGC CAGAGCAGAT TCTGATAAAT TTAAAATTTC ACAGATTTTA ACATTTAATT 2580 
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ACTCAGGCTT TGTGnAACCT AATCCTAATG ACTATGACTT TTCAAAATTA TATTGGGGAG 2700 

CTAAATACAA TGTATCTATA AGCTCACAAT CTAATGATTC AGTAAACGTC GTTGATTATG 2760 

CACCAAAAAA TCAAAATGAA GAGTTTCAAG TTCAAAATAC TTTAGGCTAT ACATTTGGTG 2820 

GTGACATTAG TATCTCTAAT GGTTTATCTG GTGGACTTAA TGGAAATACA GCTTi'lTCTG 2880 

AAACAATTAA TTATAAACAA GAAAGTTACA GAACAACATT AAGTCGCAAC ACAAATTATA 2940 

AAAATGTTGG CTGGGGAGTT GAAGCACATA AAATTATGAA TAATGGTTGG GGACCTTATG 3000 

GAAGAGATAG CTTCCACCCA ACATATGGTA ATGAACTCTT CTTAGCTGGC AGACAAAGCA 3060 

GTGCATACGC TGGCCAAAAC TTCATAGCX5C AACACCAAAT GCCATTATTA TCTAGAAGTA 3120 

ACTTCAATCC AGAATTTTTA AGCGTACTAT CACACAGAC- 3159 
(2) INFORMATION FOR SBQ ID NO: 304; 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3 821 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 304: 

GCAAAAACTT TTCTCCAACT ATGTCAGACT ATAATGGCAT GAACAAAATT GATATGATGA 60 

ATCAAAITAA AGTTGATACG ATGTTGCATG GTTATCACGC TGGATTTTTA TTTGCATTAT 120 

TGATTACAGT TGTTAGTTTC TTTTGTTCAT TTATGTTACA AGGTAAGAAA AAAGAAGTTG 180 

35 ' ATTCTCGTCA ATAAATATAA GTTGCTAGCT ATATAAAGCr TTTTAGCAAA AGTTCAACAT 240 

ATTGACTTAT CCGGCATTTC AGATTAAAAT ATTTTTATTC CGATTAGAAT AATAAGAATA 300 

AGGAGATATA TTCTATGAAA AGACTTTTAT TTGTGATGAT AGCTTTCGTT TTCATATTGG 360 

CTGCATGCGG AAACAATTCG TCGAAAGACA AGGAAGCTAG TAAAGATAGC AAGACAATTA 420 

ATGTTGGGAC TGAGGGGACT TATGCACCAT TTAGTTTCCA CGATAAAGAT GGTAAATTAA 480 

CTGGTTACGA TATTGATGTT ATTAAAGCAG TGGCTAAAGA AGAAGGTTTA AAACTTAAAT 540 

TTAATGAAAC TTCTTGGGAT TCTATGTTTG CAGGTTTAGA CGCAGGGCGT TTTGATGXAA 600 

TCGCGAACCA-AGTAGGTATT AATCCTGATA GAGAAAAGAA ATATAAATTT TCTAAGCCTT 660 

ACACATTCTC AAGTGCTGTT TTAGTTATTC GTGAAAATGA AAAAGATATT AAAGATTTTG 720 

ATGATGTTAA AGGTAAGAAG TTAGCACAAA CATTCACATC TAATTATGGT AAATTAGCTA 780 

AGGATAAAGG TGCTGATATT ACAAAAGTTG ATGGCTTTAA CCAATCAATG GATTTATTAT 840 
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PiPAPJKCCTPiPi 


TGcTAAGATC AAAGCAATCA 


AAGGTAATGC 


TGAACAAAGT 


AGATCTGCAT 


960 




TTGCATTTTC 


TAAAAAAGCA GATGATGAAA 


CAGTTCAAAA 


ATTCAATGAT 


GGCTTGAAAA 


1020 


5 


AAATCGAGGA AAACGGTGAA TTAGCTAAAA 


TAGGTAAGAA ATGGTTTGGT 


CAAGATGTTT 


1080 




CTAAATCTAA ATAGCGAACA ' ACAACATGCG 


CTAGATGCTG 


CAAAACAAGC 


TTTCGGACCT 


1140 


10 


ATGCTAGAAG 


GTTTGGTCAA ATATTCAATT 


CCTATTACAT 


TAGTTACATT 


TGTTTTAGGA 


1200 


TTGATTATTG 


CATTATTTAC AGCATTAATG 


CGAATTTCAA CGAGTAAAAT 


TTTAAGAAGT 


1260 




ATTTCACGTG 


TCTATGTATC TATTATTCGA 


GGAACACCAA 


TGATAGTACA 


ACTATTTATC 


1320 


IS 


ATATTTTATG GTATTCCAGA ATTAGGTAGA 


TTATTAACAA 


ATGACGCTGA 


CAACCAATGG 


1380 




ACATTGGCAC 


CTGTAGTGGC TGCTATTATT 


GGTTTATCAT 


TAAATGTAGG 


TGCGTATGCT 


1440 




TCGGAAATTA 


TTCGTGGCGG TATTATTTCT 


ATACCGAAAG 


GACAAACAGA 


AGCTGCaTAT 


1500 


20 


TcCaTCGGTA 


TGACGTATGG TCAAACGATA 


CAACGTATCA 


TTTTACCGCA 


GGCAATTCGA 


1560 




GTGTCGATTC 


CTGCACTAGG TAATACATTT 


TTAAGTTTAA 


TCAAAGATAC 


ATCATTATTA 


1620 




GGATTTATTT 


* 

TAGTGGCTGA AATGTTTAGA 


AAAGCTCAAG 


AAGTTGCGTC 


TACAACATAT 


1680 


25 


GAATATTTAA 


CAATTTATGT GTTAGTTGCG 


CTAATGTACT 


GGGTGGTATG 


CTrrATTATT 


1740 




TCAATTATCC 


AAGGTATCTA TGAATCTTAT 


ATTGAAAGAG 


GGTATCGCTC 


ATGATTCAAT 


1800 


30 


TGAACAATAT 


CCATAAATCA TTTAATGATG 


TTGAAGTCAT 


CAAAGGTATT 


GATTTATCTG 


1860 


TTGAACAAGG 


TGAGGTTGTA ACCTTAATCG 


GTCGATCTGG 


TTCAGGTAAA 


ACAACATTGT 


1920 


■ 


TACGTATGAT 


TAATGCATTA GAAATTCCAA 


CTGAAGGTAC 


AGTTTATGTT 


AACGGCAAAA 


1980 


35 


CATATACATC 


TAAAGATAAA AAATCACAAA 


TAGAAGTTCG 


TAAACAGTCT 


GGTATGGTAT 


2040 




TTCAAAGTTA 


TAACCTTTTT CCGCATAAGA 


CGGCATTAGA AAATGTAATG 


GAAGGTCTTA 


2100 




TCACAGTTAA AAAGTTGAAA AAGGATGAGG 


CACGTGGGAA 


ATCACTTGAG 


TTACTTGAGA 


2160 


40 


AAGTTGGTTT 


AACACATGTC AAAGATCAAC 


GTCCACATGC 


ATTATCAGGT 


GGTCAACAAC 


2220 




AACGTGTTGC 


TATTGTCAAG AGCACTAGCA 


ATGAACCCTA AAGTGATGTT 


GTTTGATGAA 


2280 


45 

- 


CCAACATCTG 


CACTTGATCC TGAACTTGTG 


AATGATGTTT 


TAAAGGTTAT 


TAAAGATX-IX; 


2340 


GCTAATGAAG 


GCATGACAAT GGTCATTGTG 


ACACATGAAA 


TGCGTTTTGC 


TAAAGAAGTA 


2400 




TCTAATAACA 


TTGTATTTAT TCmTGAAGGC 


ATGATCGGAG 


AACAAGGGGC 


TCCAGAAGAG 


2460 


SO 


ATGTTCAATC 


GTCCGAAAAC AGAAGAATTA 


AGACGTTTCT 


TAAATGTTAT 


AAATGAAGAA 


2520 




TAATCAAATA 


GAACCACGTA TCATGTTTTA 


GTATGGCGAT 


GAAGCCATAT 


ACATGATGCG 


' 2580 




TGGTTCTTTG 


TTATGTTGTC ATAATCTTGG 


AGCGATATTT 


TAACGACGTT 


TATGATTTAA 


2640 
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TTCTACATGT GCGTTAAAAC CTTTTTTGAA TTGTrGGACG CCATAGTCTT CTGATGACTC 

TGAAAAGTCA CCGGTAATAC CATAAAAATT ATAGCGATCA ATATGATGCX5 CTTTAGCAAA 

CTTAATCATT TCCCaCTGCA AATGGTAGGC ACCCATATAA GCATTATATT TAGGGTTTGA 

ACCACTAGAT AAGTAATAAA CTTCATGCTC ATTGTAGATA AATAAAGCAG AAGCTAAGTT 

TAAGACTGCA CCATCTTGTT CAATTTGTTC TATTGTATTG TCGATTTTAC GCTTATTGCT 

ATTTAGCTOT TGTTCTAGCT GTGTGCGTTT CGTTTTATTT TTCTTTGAAT TAGGACTTTC 

TTCCAATGCT TCTTCAACAC CTGAGAGTTC AGCTGTTAAT TGTTGTTGCT TTAATTGTAA 

CGTTTTTAAA TACTCGTTTA AATCAATATA CGCCAACTTT AACATGGCGT GGTCATCGTA 

TAACTTTTGC ATTTCTTCAA AGTATGGTAA CTCACGGAAT TTGAAACCGT GCTTTTCCTC 

AGCCATATGG AATAAGTCGA AAAAAGTTTG CGTTTCATCA ATCGTTAAcG TTTTaGTTTT 

GACACCAAtA TCaTATGTtT tTtTAATATT ACGTCTCGtT TGATAATCCA TTTCTTTTAA 

AAGTTGGTCT TCAGTCTTAT CTTTTAAATC TAACACTGAC AGCCAACGGA TTTGGCTCAT 

TGAATCATAA CCTACAGGGA AACCTTGGTG TTTATAACCT AATTTATCCA TTGTTCTaAC 

AAATGCTCGG TTATCATAAG ATTTAACAAT TTCACCGTCT GCATTGCGTA AATTTTCAAT 

TAAATATGGA TCTACAAGGA CATATAAACA ATTGTGTTTC TTTAAATATG ACGTTAATGC 

TTTAAAGAAA AATGCTACTA ATGATTGATT TGTATAATCC ATCACTGGCC CGCGATGTGT 

ATAAAAATAT TTGAAAAATT TAAGTGTGOO TOCTTCTGTC AATAAGCATC CTGCAATCAC 

TTGACCAnG TCATCTTTAA CCCCTACrAG ATGCACATCG CCTTTTAAAT CAACTCTATG 

ATTGTAATGA ATAGCTGATT GTGTGTAATG TGAAAAATGC T 

(2) INFORMATION FOR SEQ ID NO: 305: 

7 {i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1422 base pairs 
(3) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



2760 
2820 
2880 
2940 
3000 
3060 
3120 
3180 
3240 
3300 
3360 
3420 
3480 
3540 
3600 
3660 
3720 
3780 
3821 



45 



SO 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 305:- 
GCGACACCAT TGTTTGCAGC AACTGTTAAT TTACCAGTTG ATGGTTTCGA CGGTGTTGTT 
GGTTTTGATG GTGTAGTAGG GGTAGTTGTA GATTGCGTAC CCCATGGCGC CACTTTACCC 
ATTTTTATTA AATATTTTTC ATTAATTAAG TCATATAATT GATCATAACT ATAATTATGA 
CTTCTTAAAT ATCCATGTGG ATcGGCATGG TCAGTACCAC CTAAATATTT ACTTACAGCG 



60 
120 
180 
240 
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TATTGTAATT GTGTAGCTGC ATAGTCAGCA TAGTTATTCA TTGAACGTGC AAATGAAGCA 
TAGTCGTGTG TGTGTACGAT TTCAACATTG ATGAATCTAG GGTTACCGAC TGCACCGACA 
CCCCAAGATA AGTAATCCGT TGGTGCTGTT TCGATTATAC GATCCCCATC AACAAATGCA 
TGTACGAATG CGTTTTGATA GTTATTTTTC ATATAACTAA TTTCACCATT TATCGTCGAA 
CGATCATTAG CTGTATCATG AACTACGATA CCTTCAGGAC GACCTACGCC GTTACGGTAT 
GCGTATTTAG GGAAGTAAGA TGTATAATCT' TCrTCAATTT TAGGTGCTTT TAAGTTATTT 
TTACAAATGT AATCGTTAAT TGAAGAGTTT ACTTGTGGTT TATATTTTGG CAAACTCGTT 

tttggtgttg cagcaactga tcttggttgt gctgaagcgc taaaagtagt tactttaggt 
gtcgcttcag ttttagcttt aggtgctgat gtagttgcag ctttaggtgc tgcggtttta 

TATTGCGTyr CAAGAGCTGC AGGTTTAGCA GCTGATTTAA TTAATTCTGG ATTAATTTGA 

ttttctgaat tatcatcttc atcatcaact aaactataac cagcatttgt aacattagtg 

TTAGTTTTAG GTGCTGTAGT GCTTGTTGAC TTTGCAACAG GCTGCGTATT ATTTGTAGTC 

• • , . ' 

GCTGATTGAT TAGCACGAGT GTCACCATTT ACTTGTGCAG TATCAACTTT TTGACTTACr 

tgagcattgc ctgttttgtt atttgctgtt tttggttgga caatagcagg gtcttgatat 

■m- . 

acttgagtgc cagaaatgtt ttgcgttgga ttttttacct cagcttttgc ttgttcagta 
gttgctttaa ctttattact atctaaaacg tttttattag tagtttgatc ttgtgtcgtc 
tcagctgctt gaacttgatg tgcagtgact gctgaaccta caagcgttaa tgcaaccatt 

GAgGTAGTTT GTAATTGAAT TTTTTCGCCA TTCTATTTAT TACTCCyAAC ATTTATTAAT 
TATtACTAAC ATTATAGTAC CTGTnTTATA TACCTGTGCG TA 
(2) INFORMATION FOR SBQ ID NO: 306: 
Zii) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 6076 base pairs 

(B) TYPE: nucleic acid 
iO STRANDEDNESS : double 
(D) TOPOLOGY: linear , - 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 306: 
ACGCGTTGGT TATTTCAATC ATAATATTAC TCTGCAAATA CACAGCCCTG TAACCGAGTA 
AATGGATAGA GATTTGAACA AATGAAAACA ATCAACTAAT GGAAAGGATA AAATATTATG 
CACAACAATA ATGAATTCAA CAAAAAACTG AAAGATTTTA TAGGTAGCGA TAAACGGATG 
GCTTTAGTAA AGGGTTATGT TAACGAGTAT AAATTAACAA CTGTTTTAAG AGCTTTAAAT 
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GTAGATAATC GAATTATTCC TAAAAATATA ACTCAAAACA CAATCTTCAA ATTGAGTAAT 
TTAACCTTAG AGGTTAACCT CTATGAAAGA AACACAATTT ATCACGGAGA CTTTGCTATT 
TACTATCCTG TAGAATCTGC TCTAATAATA GAAACAGATA CTCCTAGGCT AATTAATCAT 
ATAAATAACA ACCCAGTCCA AAAAATATTT ATAATAACAA CAAATGACTG GAGCTTTAAT 
ACACTTGaAT TAGAAAAAAT AGTAGACGAA ACTATAATTT ATGATTTAAA ACAAGAAGAT 
CCTAAACAAT ATGAAATTTT ATATAAAAAT AAACACGGAA AATTGCCTTA TTGATGAATT 
AAAACGCAAA CTTAGAACAC CTTACCCCTT TTCCGTCCTT ATTGTAATTT TCCAACTACT 
CAAATTAAAA ACCACCCGTG CAAACAGGTG GTTTTATTAT ATATAATTAT TCCCACTCAA 
TTGTGCTTGG TGGTTTTGAT GTAATGTCAT AGACTACGCG GTTGACGTGA TCTACTTCGT 
TTACGATACG ACTAGAAATC TTTTGTAAGA CTTCCCAATC GATGCGTGCG AAGTCACTTG 
TCATACCGTC GATAQATGTT ACTGCAC6AA TACCTACTGX GTGATCATAC GTACGGTAGT 
CTCCCATAAC ACCTACTGAT TGAATGTTTG GTAACACTQT QAAQTATTGC CAAATTTCTC 
TTTCAAGACC TTCTTCTCTA ATCACTTGGC GTAAAATCGC GTCTGATTCT CTAACGATTT 
CTAGTTTATC TTCAGTAATT TCTCCAAGTA CACGAATACC AAGACCAGGT CCTGGGAATG 
GTTGTCTCCA TACTAAATGT TCTGGAATAC CTAACTCAAT ACCTAATTTA CGTACTTCAT 
CTTTAAACAA TGTATTGATT GGTTCGATTA ATTCGAATTC CATGTCTTCT GGTAATCCAC 
CAACATTGTG GTGTQATTTG ATTGTTTGTG CTGTTTTAGT ACCTGATTCG ATGACGTCTG 
TATATAGTGT TCCTTGCGCA AGGAAGTCTA CACCTTTCAG TTTTGATGCT TCATCATCAA 
ATACGTATAC AAATTCATTA CCAATGATTT TAOGTTTTTG TTCAGGATCT GAAACACCTT 
TTAATTTATT CATAAAGCGA TCTTTCXSCAT TAACACGAAT AATATTCATG TTGAAACCTT 
CACCJGAATTG CTCCATAACC ATGTCGCCTT CACCTTTACG AAGtAAGCCA TGGTCTACAA 
AGATACATGT TAGTTGATCA CCTATTGCTT TATGCAATAG TACAGCTACA ACAGATGAAT 
CTACOCCGCC ACTCATCXSCA CATAATACAC GACGGTCTCC TACGCGTTGA CGAATCTTTT 
CAATTTCGAT TTCGATAAAG TTTTCCATTG TCCATTGACC TCTACAATCA CAAACACGAC 
GGACAAAATT ATTTAATAAA TCATTACCAT ATTCTGTATG ACXSTACTTCT GGATGGAATT 
GAACACCATA AATGCGACGT TTCTTATCTT CGATTGCTGC • ATAGTCTGTG CTTGGGCTAT 
CAGCGATAAC TTCAAAGCCT TCTC3GAATTT CAATAACTTT ATCAGAATGA CTCATCCAAA 
CAGTTTGTTC TGCTGGTAAG CCAGCGAATA ACTCATCTGA CTTCGCATTA ATGATTGCTT 
TACCX3TATTC ACGTTCATTG GCACGTTCAA CTTTACCACC TAATAATTTA GTAGTTAATT 



360 
420 
480 
540 
600 
660 
720 
780 
340 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1S60 
1620 
1680 
1740 
1800 
1860 
1920 
1980 
2040 
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TAAATGAACC TTCTTCATAA ACTGAATTTG GACCACCTGA TAAGATAATA CCTTTTGGAT 
TCATTTTCTT AATTTCTTCA ATTGAAATTT CATGATCGTG TAATTCACTA TAAACGCCCA 
TTTCACGAAT TCGGCGTGTA ATTAATTGGT TGTATTGGCT ACCAAAGTCT AAGACAAGGA 
TTAACTCTTG TTCTTTTGCC ATTTCCATAT TTGTCGTTCT CCTTTATCTT AATTAGAATG 
AGTAGTTCGG TGATTCTTTC GTAATTTGAA TATTATGTGG ATGGCTTTCT GCTAAACCAG 
CAGGACCCAT ACGTGTAAAT TGTGCTTCTT CGCGTAATTC TCTTAAATCG TGTGAACCAG 
TATAACCCAT ACCAGCACGC ACACCGCCCA TTAATTGGTA AATTGTATCT TGTAACGCAC 
CTTTATAAGC CGTACGTCCT TCGATACCTT CAGGAACAAA TTTCTTAGGC GCTTTGTCCT 
CTTGGAAGTA ACGGTCGTTT GAACCTrTTT CCATCGCACC TAAAGAGCCC ATACCACGGT 
ATACTTTATA TTGTCTACCT TGGAAAATTT CTGTTGCGCC TGGGCTTTCT TCAGTACCTG 
CTAATAAGCr ACCTAACATA ACCGCATGTC CACCAGCAGC TAATGCTTTA ATGATATCTC 
CTGAGAATTT AATACCACCA TCAGCAATGA TAGCTTTACC ATGTTTGCGr GCTTCAGTtG 
CACAATCATA AATTGCTGTA ATTTGTGGTA CACCAACACC TGCTACAACA CGCGTCGTAC 
AAATTGAACC TGGGCCAATA CCAACTTTAA CAATATCTGC ACCCGCTTCA AATAAATCTT 
TTGTTGCTTC TGCAGTTGCT ACGTTACCTG CTACTAATGT GATTTCTGGG TAAGTCTTCT 
TAATATGTTT CACTTGATCG ATAACACCTT TAGAGTGACC ATGTGCTGTA TCGATAACTA 
AGACATCCAC ACCTGCTTCG ACTAATTTTT GAGCACGAAT AXCAGTATCT TTTGAAATAC 
CAATTGCTGC GGCTACAAGT AGACGACCAT GTTCATCTTT TGCTGCATTA GGGAATTCGA 
TAACTTTTTC AATATCTTTA ATAGTAATAA GACCTTCTAG ACGTCCGTCT TTAACTAATG 
GTAACTTTTC AATCTTATGT TTTTGGAGAA TTTTTTCTGC TTCTTCAAGT GTTGTATTCA 
CTGGAGCTGT AATTAAATTt TCTTGCGTCA TTACATCTAC AATTTTAATC GAGAAGTCTT 
CAATAAAACG TAAGTCACX3G TTTGTTAAAA TACCTACTAA GTTGCGATCT TCTTTATTAT 
CAACAATTGG TACACCTGAA ATACGGTATT TACCCATTAA TGCTTCTGCT TCATAAACGC 
TTTCTTCTGG CGTTAAGAAA AATGGGTTTG AAATGACACC ATTTTCTGAG CGTTTrACTT 
TTTGAACTTC GTCCGCTTGT TCTTCAACGC CCATATTTrT ATGAATAACA CCTAAACCAC 
CTTGACGAGC CATAGCAATC GCCATTTTAG ATTOVGTTAC AGTATCCATA CCAGCAGAAA 
TAACTGGAAT ATTTAATTTA ACTTTGTCTG ATAATTGTAC GCTTAAATCA ACGTCTTTCG 
GTAAAATATC AGATTGTGCT GGAATTAATA ACACATCATC AAACGTTAAT GATTCTTTTG 
CAAATTTACT TTCCCACATT AAAAACAGCC TCCATTTTTC AAATTAATTA GTTATATTAT 
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GCAGAGATTG CXJCCTAAAAC AATTCCGTTT TGAGTCAACC ATGCAAATTG TTCACCTAAA 
CCTTTAAATG CTTGTGGTAC AGCGCTTATA CCAGTACCTA AtCCTACTGA TACAGCGATA 
ATTAATAAAT TGTTTTGATT TTTAAAATCG ATATGTCCTA ATATACTAAC ACCATATGCC 
ATTACCATGC CAAACATAGC TATCATCGCA CCGCCTAACA' CAGGTAGCGG TATGATATTT 
GCTAATGCGC CAAGCTTAGG TATACAACCA CATATAAGTA ATAACACGAC CATGCCGTAT 
ATAACATTGT TTTTCTTAGC GCCGGATAAA GAAACAAGTC CTACATTTTG CGAATAGGCT 
GTATACGGAA ATGAATTGAA TATAGAACCT AAcACTATCG CTAGACCTTC CGCAGTATAA 
CCTTTACGAA AATCTTXTCT TTCTAACTTC TTACCGGTAA TTTCACTTAA CGCATGATAG 
ACACCTGTCG ACTCAATTAA ACTAACGATA GCTACAATAA AGAACACTAA CGTCGATGTC 
ACATCAAAGC TAAATCCAGA GAATCTAAAC GGCACTGGGA TGCCTAACCA ACCGGCATGA 
TTGACTTGAT TAATATCGAC CATCCCAAGT AAGCCAGGAC CTATCGTTCC TAAAACGAGT 
CCAATTAATA TGGCAATACT CTTAATAAAT CCAGTTGTGA ATCTTTGTAA AAGAAGAATA 
ATGATTAATG TCATTAAACC TAACAAAATG TTCTTAACAT CTCCATAGTC CTTTGCACCT 
TGACCTCCAG CTAAGTAATT CATTGCTACT GGCATTAAAT TGATACCAAT GATAGTAACA 
ACACTACCCG TTACTACTGG TGGGAAGAAT TTTACAAGAT GTGAAAAGAA AGGCGCGATG 
ATAATAACTA ATATCCCTGA TAAAAATAGC GAACCATAAA GTACATCTAT TCCTTTCGTT 
TGACCAATTA AAATCATGGG CGCAACAGCC GTGAATGTAC ATCCAAGAAC GATTGGTAAT 
CCTGTTCCTG TTACTTTATT GGCTTGTAAA AATGTGGCAA CCCCACACAT AAATATATCT 
ACTGTAACTA AGTAAGCGAT TTGTTCAGGT GTAAACTTCA AACTTGTACC AACAATGATT 
GGAACTAAGA TAGCACCTGC GTACATAGCT AAAAGATGTT GAACACTTAG GATTAAATTT 
TTCATTATTC TTCTCCCACC AATGTCACTT TGTTTCCTTC TAGTGAAGCA ACCTTGCAGA 

« 

GAGAAGAAAC TGTTAAACCT GCTTCTTCTA AACGTTGATG CCCATTTTGG AAACTCTTTT 
CAACAACAAT ACCAATACCA GCTGTCTTAG CATTCGCTTG CTGTGCGATA TCGTATAATC 
CTAATGAAGC ATCACCATTT GCTAAAAAGT CATCGATGAT AAGTACAGTA TCTTCTTCTG 
ATAAAAACTC TTTTGAAACA ATGACCGTAC TTGTTTTATT TTTAGTAAAT GAATGAATAG 
ATGTTTCATA ATAACCATCC GTCAAAGTGC TAGGTTTTGC TTTTTTCGCA AATAAACATG 
GCACATCAAA ATGCAGTGCA GCCATGATTG CAGGTGCGAT ACCGGAAGCT TCAATGGTTA 
AGATTTTAGT AATCCCTTTA TCTTTAAATT GCTCGTAAAA AGTGCGACCA ACTTCATTCA 
TTAACTTTGC AXCAATTTGA TGATTTAAAA ATCCATCGAC TTTTAAAATC TTCTCATCAA 



3960 
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ATTTGTGTGA AACATTTTGC TCTTAAATTG GTGCTAGATA CAAAAAAATC CCCAA^CTAA 
ATAATAGTTT CAGGGTTTAT GAGTGAACGa ACATGCATAA CGAATTTGTC ATGCAATCAA 
TGTAAAAGAA GTTTCATCAA ATAAACTGTG • ACCATCATAT AAAATGATAT AAATCACCCA 
CCATGGTTAC AATTTAATGG CTGAAGCTAC TCCTAGTATT GTGTTGTTAC TCATAGTCAT 
GTCGTTCAAG GCAACATGGT AGA?ACTTCT AAAGCCATAT TCTTTAGATT ATATGAGTTT 
ATGTAAATTA TTTAACGATA ATAGCAAATT TTCGGCATTT TTTCAATAAC TGCTTAGGTA 
ATCTTTTAAT AGTTTT 

(2) INFORMATION FOR SEQ ID NO: 307: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 613S base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 307: 



ACCGCCGATT 


GATAGCTTTA 


CTGCTGCGAT 


AAAACTGCCT 


TCAACAATTG 


GTGCATCAAC 


TTTTAACACA 


CGATGATTAC 


CATCATACAT 


TTCAATTGCC 


ATATCTACAT 


TCATTTCTGA 


AGATCCAATA 


TCGTAAAAAC 


ACAATGCATC 


ATCCTCTAAT 


TTAGTCAAAA 


CTTCTTGGAT 


GATATCAAAT 


GAAGTTCCAA 


TTGAACCATC 


TGGTAATCCC 


CCGATTGGTA 


TAATATCAAC 


GTCACCTGCC 


ATTTGCTTTA 


ACAAAGATTT 


TGTACCACTT 


GcAATTTCTT 


TACTGTGGCT 

• 


AACAAGTATA 


ATTTTAGGCA 


TTATCTTCAT 


CTCCAATCAA 


AGCGTTTAAA 


ATATAAACCA 


TACTTTGAGC 


ACCTGGATCA 


ATATAACCTT 


TTGATTCTTC 


TCCAAAATAT GCAGCTCTAC 


CTTTCGTTGC TACCATATCT 


TTTGTATTAT 


CTGCTAATTG 


CTGTAAATCA 


TTGAATGTTA 


AAGTTTCACC 


ATTTTTAAGC 


TTCTCTGCTG 


CTCGCGCTAC 


TACATCATAC 


ATTGTCTTTT 


CATTTAAAGT 


AACriTACCA 


CGTGATTCAA 


CCGCTTCGGC 


AAATGCCTGA 


ATTAGTGTAA 


TGAAATCTTG 


ATTATCCATA 


TCATCTTTGG 


TGACTGCAGA 


CATTTTAACA 


AAGCTAAAGC 


CATACAGTGG 


TCCTGATGCA 


CCCCCAACAT 


TTGACATCAA 


TGCCATACCA 


GTTGATTTGA 


ACAATGATTG 


CATTGAGCTA 


TCATCAAGTT 


TGTCTTTAAG 


ACTACTAAAC 


CCACGAACCA 


TGTTAACCCC 


GTGGTCACCA 


TCACCAATTG 


CTCGATCTAA 


TTCAGTTAAT 


TCAGATTCAT 


GTTTTTTAAA 

» 


CGTTTCTTCT 


AAATTTAATA 


AACGTGCTTT 


CATATCATTC 


ACTTTCATTT 


GTGCCACCTC 


ATAAATGTAT 


ATTTATTCAT 


ATTCACTTCT 


TATTTAAAGT 


ATTGACTTGT 
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ACCTTGCATG TCTAAAGATG TCATATAATC 
TCTTGCAGCT AAATTTTGTT GAATATATTT 

5 

ACCACCCATA CCATTTACCA TTAATATGAC 
GTCTAACAAT GTTCCAACAA TATGATCAAT 
TTCACCATGT ATACCAATAC CGATTTCCAT 

10 

TCCAGTAGTT GGAACAAGCG GTGGCTCAAT 
CAACGCTTCT ACACGCGATT TTATCTCTGT 

,5 GGCAAGCTTA TGAACAAACA CTGTTCCTGC 
AGCAATGTCG TCACGAACAA TAACAGTTTG 
TTGTGCCATT TCX3AAATTCA TCACGTCACC 

20 ATCACCAGTA rCTACTGCTT TAATAGCTTC 
TACTTCGCCA CAAACCGCTG CATCTAGCAT 
TTCATGTCCG CTTCCACCTC CAGAGACTAT 
TACAATAACT GTATTAGCAA TCAGATCTAA 
CATATCAGTT AAAAATGTTT CTTTTTTATT 
TGGTATTATC AGTCATAGTA TAAAACAGAA 

30 

CTGATACCGT TATCAAATAT ATTTTTGATA 
TTGAAAAAAT AAATAGTCTT GAGTGGCTCA 
AATAAAGTGC CTTTCATAGC aATAAGTTGT 
TACATTAAAT ATAAGAAATA CGGTGCACCA 
CCACCTGGTT GTAATACAAT TTTGCCAATT 
40 ACTAAAATGG CAATIGGTAA AAACAACTGG 
- TGCGGACCCA TTAATCCGAT AAACGAAATT 
AACAXCACTG CGATAAAGAA TAATATTAAA 
CGTGCAATAT TATCACCCGT . ATGAATAATA 
GGAATAATAA TCAACACCCA CGGTAAAAAT 
ATATTACCTG CAAACCAAGC AGCGATGAAA 

SO 

ATTGTAATTG AGCCACCATA TAATGCTGTT 
GCAGGTGTAA CACCTTCATT TTTATTAAAA 

SS 



P0 786 519 A2 

ACCAACAAAC CATTTAGCAA CATTAACCGT 1080 

AGTTACGATA TTTAATTCAG ATAACGGCGT 1140 

ATCATTGGCA GTAACTTCTT TATACAATTC 1200 

ATCCTTTACT TCTTCCCTAT GAATACCTTT 1260 

TTTGTCGTCT TCAATATCAA AGCCATATTT 1320 

TGCCATACCA ATACTTTTAA TTTCAGGTAA 1380 

TAATGAATAA CCTTTTTCAG CAAGATAACC 1440 

AACACCACGA CGTTGTACTT CGTTTGTCAC 1500 
AACATTTATA CCTTCCATTT CTGCAAGCTC . 1560 

TGCATAGTTT TTTACAACTA GTAATACACC 1620 
TAATATTTTA TCAGGTGTAG GTGATGTAAA . 1680 
ACCTTCTGCA ACAAAACCGG CATGCGCAGG . 1740 

TGCTACACCA TGTTCTTTCT TAGCTTTTTT 1800 

CTCTGGGTGC GCAATTAACA ATCCTTCAAG 1860 

GATTAACTTT TTCATCATGT TGTACCTCCT 1920 

TAAATGAATG CGCTATCATA AAGAATTAAC 1980 

AGATCCrCTT GATAACTTAA TGGTTCATTA 2040 

TTAAATAAAA AATGCTATGA AAAGCCTTAT 2100 

GTCCATTGAC ACTATACATT TTTCGTTTTG 2160 
ATAATTGCTA CGACAATACC TGCTGGAACC ^ 2220 

GTATCAGCTA TAACAAGTAA ACATGCCCCT 2280 

rGACGTGGTC CAACGATACG TTTGGCAATA 2340 

GAACCTGCTA CTGCTACAGC AGCAGATGAT 2400 

CGTTCTCTGC TTAACCTTAC ACCTAGACCT 2460 

TTTAGTGTAT TOGATTTAAA TAGTAAGTAA 2520 . 

GCAATGACAA ATGGCCATTC GTCACCCCAA 2530 

TCAGATTGCT TATCATCAAA TTTTGACATA 2S40 
TGTAAACCTA CACCTATTAA TACCATACTC ' 2700 

CTGaAAATAA AAATAATCaA TGCAGTGgTG 2760 
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CCAATTGCAA TAAATAATGC GATTGCAAAT CCGCCACtGC GTTAATACCT AATATACCTG 
GTTCAGCTAT TCGATTTTTT GTGACACTTT GCACTATTGC ACCACTAATA CTAAgCtGCG 
CCAGCCAAAA TAGTAATCAT CATCCGAGGT AACCTGAAAT CTAATAAGAT TAACTCATCA 
ATGGCATCAC CTTGTCCAAT TAAAGTTTTG AAAAATCTTT CAACAGGTAT GTTGTATTCA 
CCTGAGGTAA TACTCCAAGT ACAACCTAGA AATAGTAGAA TGCTAAAAAC AGCCAGTGCT 
ATCAATTGTC TGCGTTTATT ATTTGAACTA ATCATATTGA GCGTCCTCCT TTTTTAACTA 
AATATAAAAA GTAAGGAACA CCGATAAATG AAATGATTGC ACCAACAGGC GCTTCTCCTA 
AATATCGTGC TATCACATCG GCAACAAGCA CGAGTATCCC ACCTAACAAG GCTGTTAATG 
GTAGAATTTT AGCATAATCA GTTCCAATTA AAAATCTTGC. TATATGAGGT ACCATCAAAC 
CTACAAATGC AACTTGTCCA GCGATAGCAA CTGCAATACC TGCTAGAATC ATAGCAATAA 
TTAAACATAT GCCTCTGATC ATTGTTACAT TTTGACCTAA ACCTTTAGCT AATGATTCAC 
CAAGATTTAA AATGGTAAGT TGTTTACTAA TTGTTAATAT AATGAATAAC GCAATACCAA 
TTAATGGAAT TGCCCACTTA AGGTGTGACC ATGTTGTGCC TGAAACGCCT CCAGCAGTCC 
AAAATGTTAC TGTTTGATTT AGTCTAAAAG CTAATGCAAT ACC7TGACTT AGCGCTGTTA 
ACATAGCACT TACTGCTGCA CCCGCTAAAA TAATACGCAT CGGATTAAAT CCATCACGTC 
TAGATCGGCC TATCATTAAT ACAATAGCAC CTCCTAGAAT AGCACCTAAA AATCCAGCAA 
ACATCAATAT TAAAAATGAA GTGTTTGGTA AAACTGCATA TGTTAATGCT AAAGCAAATG 
AAGCACCTX3A ATTTAAACCT ATGAGCGCCG GATCAGCAAG ACCATTACGA GTAACACCTT 
GTATAATCX5C ACCAGAAACT GCAAGCGCCA TACCTACAAT TACTGCTGCT ATATTTCTGG 
GAATCCTAAT CTCATTGATG ATGTTTTGCT' GTTGATTGCT AGGATTATAA TTAAAAATAG 
CCTCTATAAT TGTAGAGGCT TGAATTTTGG CGTCACCTAT TAATGTAOAA ATAAATAGTG 
TGATTAGTAG TATCATACTT AAACCTATAA TATAGGATAA AAACTTCAAT GGCGTTGGGT 
TCTCTCTATT TGTCATGTTA ATTGTCCTTT TTAXCATATT AACTTACTTA ATTAAGAATA 
AGCTCTGCGA CATAAGTCAT AAGTTACCAG TAAAGGTTTT CCAGTTTTAG GATCTTTACT 
TAAAACAACA TCAATATTAA AAACTTTTTC TAATATTTCC TGTGTTAATA .CGTCTTCTGT 
TGAACCTGTA GCGATGATAT CCCCTTCTTT CATCGCAATA AGATGATCTG AGAAACGAAT 
CGCTTGGTTG ATATCATGAA GAACCATGAC AATTGTACAA CCTTGTTCCT GATTTAGCTT 
CTGAACTAAT TCTAGTATTT CTAATTGATG ACAGATATCT AAATATGTTG TTGGTTCGTC 
TAAAAAGATA ATATCAGTTC TTTGTGCTAA TGCCATTGCA ATCCAAACAC GTTGTCTTTG 
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TGCCCAATCA ATtTCTTTCT TAtCCTCAGC AgTTAATCTA CCAAATCCTT TTTGATGTGG 4680 

AAAACGACCA TATQAAACTA ATTCCCCAAC AGTTAAGCCA TCTGCTACTT CaGGTGaTTG 4740 

aGGTAAAaTG GCtATTTTTt TGcAATCyCy TTCGTAGATt GTGtATGAAT ATTTTCACcA 4800 

TCTAAAAATA CTTCGCCTTC TTTAACTGCC AATAAACGTG ACAATGCCTT TAGCAAAGTA 48S0 

GATTTCCCGC AGCCGTTAGG ACCAATGATT GACX5TCACrT TGCCATCTGG TATTTCAACA 4920 

TCTAATTTAT TTATAATCGT GTTATCCCCG TAACCAATTT ' TAACTTGTTG TCCATGCAAA 4980 

CGATTCATAA TTTCCCTACT TTCAATAAAA TTCTTTCTGT TTATAAAAAA TAATTTCTAT 5040 

TTTTAAATTA TCAATTTTCA AAGACATCCC AATTGATAAT GATTATCATG AACATCATTA 5100 

TAACATTTTT CAATCTTATT GACTAACATT ACTTTTTAAA TTGGATAGCT CGATTTGTCA SlSO 

TGTCTTGTAT ATTA C TTTT A TAAAATAAAA AACGCCCACA GATAAGTCTT CATAGTTCAA 5220 

20 AAACTTGTCC GTGGACTTCT ATTTAAGTAT GTGTGCTCAT ACCATTTATT TATTCATCTG S280 

CAAGAAAGCC ATTACCATAG ACATCTCTTA CATCATGAAT TACGAGGAAT GCATCTTTAT 5340 

CGATTTGTTT AATTAATCGC TTTGCTTTTG AAACTTGTGT TTTAGAAATA ACAACGTATA 5400 

AGACATCTTT TTCTTCACGC GTATAATAGC CATGTCCGTT TAAAATGGTT AAACCTCTTC 5460 

CAATTTGCTC GTCTATTGCT TTGGCAAGTT TGTOGGGATT AGTTGAAATA ATCGTCATAG 5520 

« 

CTTTTTTAGT GTTTAAACCT TCTATGACAT ATTCCATCAC TTTTGTTCCT ATATAAAGTG 5580 

ATATTACTGT TACTAATACT TTATCAAGTG GAATAACTGT AAGTGAAATT GCAACAACGA 5640 

TCATATCGAA GAAAAGCAAA GCATATGGCG TGCTTACATC GAGGTATTTC GTTGCAATTC 5700 

TCGCCAAAAT TGTTGTACCT GCTGTTGTAC CGCCTGCAAG GATAATTACT CCGATTCCTA 5760 

GTCCAACGCT TACACCACCA AAAATGGCAT TCACAATGCT GTTTCCAGTT TCTACTTGCC 5820 

ATCMTCTGT TAAACTCAAA AATATTGAAA TAAGAATTGT TACAAGAATA GTTAAGTACA 5880 

40 TACTTCTCTT ACTCAAAAAt TTATAAcCTA TGGCAATCAA TACTGCGTTG ACCAAGAAGT 5940 

TAGTGATGGC TGGTGAAATA TGAAACGCAT AATATAAAAT AATTGCTAAA CCTGTAACCC 6000 

CGCCTTCACC TAAGTTACCA GAAAT/^TAA ATGCATTTAC ACCTGCAGCA AAGATAAATG 6060 

AACCTAAGAC AACTAGTATT AAATCTTTAA CCGTTTTATT CACGAAACCA TCCCCTTTAT 6120 

ATATTTATTA GACTAT 6136 
(2) INFORMATION FOR SEQ ID NO: 308: 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2576 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 308: 

5 

GATATCGTAS CTACTGAAAA GTCATCACCA CCATGGAATG ATTTCTTTAA ACGTTTTAGC 60 

TTCTATGCAA TTGCAATTCA ATACTTTGTT GTACAATTTA TCATTACATT ATTCTTAATT 120 

TGGTTACCGA CGTATTTAAC AGAAGTATTC CACGTTAACT TTAAAGAAAT GAGCATTAGT 180 

10 , , 

TCATTACCTT GGTTATTAAT GTTCTTCTTA ATCTTATCAG CAGGTGCAAT TTCTGACCGT 240 

GTATTAGGAT TAGGTCGTTC AAAATTCGTA GCTAQAGGTG TAATTGCAAT TGCAGGATTT 300 

t5 ATTGTGTTTG CAGTTTCAAT TATCTTTGCT GTACGCACAG GAAATTTATA TGTAAGTATT 360 

TTCTGGTTAT CACTAGGTCT TGGTGGTATC GGTATTTCAA TGGGTATGAG TTGGGCTGCA 420 

GCAACTGACT TAGGACGTAA CTTCTCTGGT ACAGTATCAG GGTGGATGAA CTTATGGGGT 480 

AATATAGGTG CATTAATCAG TCCGCTATTA GCAGGTCTAT TCGTAGAACA TTTGGGTTGG 540 

ACAATGACAT TCCAATTGTT AATOGTTCCA GCAGTAATCG CTGTGATTAT GTGGTTCTAT . 600 

GTGAAACCAG ATCAACCTTT AATTGTTAGT GATGATAAAG CAATAGAAAA ATAATTTAAA 660 

25 - .- 

CAAGCAGTAA GCTTTCACAT AGTTGGGGCT TAXTGCTTTT TTTGCGTTGA AATTGAAACT 720 

TTTTAAAACA GATATGGTTT AAGATGAAAA TGAAGTTATT GAAATGATAT ATGTAAAGAA 780 

ATAAGGTTTT AAAACATTAG TCAGGTAACG CTTGTaAAAG TACATATAAA TTTTAACTAG 840 

30 ^ . . — 

CGCAAAGGTG GGCGACCAAA GCTcAACGAT GTTAAATAAC aTTAGrAATT AATTTTAATT 900 
GGACTTTAAA AGTTTTTAAA TTTAGATAAT TGAGCATAAG GTGTTATAAT GACATATGTT • . 960 

35 GCGTAATTAA AATTTATAGC AACAAATTCA TTTTAACTAT GCTAATAAAA AGATTATGGA 1020 

AATATTTTGA CAAGGAAAGG AGAAGTCGAA ATGACATCTT TTTGACATCA CTCATAAAAA 1080 

TCAAtCGACT TAACTTAGAC TTTTATAAAQ GTGTAAGACA GGGACTGTTA ATGATTATTC 1140 

40 CTGCAATAAT CGGTTACTTA TGTGGTAATT TCCAATTTGG ATTATTAGTT GCAACCGGAA 1200 

CACTAGCCCA TATTTATGTT TTTAAAGGTC CGTCGCGATC TAAGCTGCGA ACTGTAATAA 1260 

TTTGTAATTT AGCGTTTGCA ATATGTATGA TGCTTGGTAC GCTAACAGCC AAAACGCCAC 1320 

45 

TCGTTTTTGG AATGACATTA TTAATTGTTA CGGTTATACC ATTTTATATA TTTACTGCCT 1380 

TAAAAATAGC TGGACCGTCA TCGACATTCT TCATTGTGAC . ATTCAGTCTA CCCATTAACT 1440 

TACCTATAGC TCCCGAAGAA GCATTATATA GAGGCTTTGC GATTTTAGTA GGCGGTATAC . 1500 

SO 

TTGCCACTAT GATGGTGTTA ATCACGATCG TATTTTCTAA' AAACAAAGCT GAAGAACAAG 1560 

CAATTCAAAA TGATTTTAAA CTCATATCTA AGTTGTTACA CACTTATAAT GATAAATCTG 1620 
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TCACTTCTAC TTCAAGTAAC GATAAATTAA GTAGACGTTT CCAAAAATTA TTATTATTAC 
ACACATCTGC CCAAGGGATT XATTCTGAAC TGTTAGAGTT GAACGCTAAA CAAATTCGAC 
CATTGCCAGA TGAGTTAATT GAAATGATGG ATCATATCAT TGCACAACTA GATAATAGTG 
AGGAAAATGT AAGATATTGG CGAAAAGAAG TGACAGTAAC AGAGGAATTT CAAAATTTAT 
TCAACCATAT ATTGAAAATT GATGAAATGG TGCATGCAAA TGAAGCGCGT ATTGCGTATG 
AAGCAGACAT GCGAAAACCT TTATATAGTA AACGCATTTA TCaAAATTTA ACaTTAGACT ' 
CtATkGXTTT TAGAAATACA TTGAGATATA CAGCGATTAT GATGATAGCG ATATTTATTG 
CGTTAATGTT TGATTTTQAA AAAGCATACT GGATACCGTT ATCTGCACAT ACAATATTAC 
TAGGAACATC AACTATACAT GCAATCGAGA GAGGTATGGC ACGAGGTTTA GGTACTATTT 
TAGGTGTGTT AGTACTTTCA GTCATATTCT TGTTTTCAAT ACCAACACCT GTTGCAGTAA 
TTTTAATGGG CATTGCAGCA TTGTTTACTG AAGCATTGGT GGGAGCAAAT TATGCGATTG 
CAGTAGTTTT TATTACAATA CAAGTTATTT TAATGAACGG ATTAGCATCA CAGAATTTAA 
CAATTAACAT TGCGTTTCCA AGAGTTATTG ACGTTGCAAT GGGTATTGTG ATTGCAATCA 
TAGGTTTATT TGTCCTTGGA CAACGTACCG CATCCGCATT GCTTCCTAAT 6TAATGGCTG 
AAGTTGTTCG TAAAGAAGCA ACGCTCTTTC ATTATTTATT TTCTGAAAAT CAATAT 
(2) INFORMATION FOR SEQ ID NO: 309: 
(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 668 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : dovible 

(D) TOPOLOGY: linear 

'(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 309: 
CAAGCACATT ACGATGGTCT AATACTTTGC TAATAATTTC TTCTTGTCCT GGTCGAAACG 
TTTCATACCC AAAGTAATGC GATAATGTTT GTTGCATCAT AAATTGACCC CTTATTGTTG 
TTCTTTAATT TCTTCTAACT CACTCCATCT TGTGATGTCT AAATCATATT GAATTTCAAG 
TTGTTCTTTT TCTTCGTTTA ATTCTTTAAT TTTCCCATAA TCTGCACTTG CCTCAATCAT 
GAGCACATCA ATTTCTTCCA TTCTTACTTC CGCTTGTTCT ATGCGTTTCA TCAATTGTTC 
ATATTCTAAT TTTTCTTTAT ATGATAAACC ATTTTTCTTA CGTACAGTTG TAGAAGATTT 
AGATTGTTGC TTCAATGTGG ATTTATTTTT ATCTAATGAT TTTTTATAAC TTTCATAATC 
TTCAAAAGTT CCGATAATCT TTTCCATCTG ACCATCATGA ATAAACCAAT ATGACTGTGC 



1151 



EP0 786 519 A2 



75 



AATATAATCT TCAAGTATTG TTAAAGTCTC AGTATCTAAA TCATTTGTCG GTTCATCTAA 
CAACAGAACA TTTGGCTGGT GTACGAGTAG ACGTAATAAA TACAAACGCT TTTGCTCTCC 
ACCAGATA 



600 
660 
668 



70 



(2) INFORMATION FOR SEQ ID NO: 310: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 12173 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 310: 
CATCAGTTTA TTTTGAAAGG CAATGCGATC ATTtCMOTA TTTATGTTGT TTGAAACATC 
GTTAGATAAC AATAGTGATA TTGCACATTT TAAGCTGAAG ATGGAAAAAT ATTCGATAAT 
CAAATAAACA ATGAATTTTA GAAGGTACAA TGACGTTCAC TAATTTAAAT ATAGCTGAAT 
GTGTTGGTGA GTGATGTTCA CTATAGATTT ATATTAATAT ACAAAGACAA AGGTTGTTAA 
TTTTTATTAA GCGTTAGGTT GAATGTATGA GAATTTTAGA TTTATAATAG AAGATAGAAA 
CGAAAATTTT TCTTAAAAGC AGTAATGTTG ACTCAAAATA AGCTATAATA ATGACACTTA 
TTTAATTGAT TAACATTTGC TAATAAATAT CAATATAGAA TATAACTTTC CAATAATGAC 
TGAGAAAATC GAAATGTCAG TCTCGAATCA TATAATTAGA AAATTGATTA TTTTCTGTCA 
ATTTAGGGTT GAACTATACA TATGATATTG TTAGAATATT TTTTAACATT ATATTTTATT 
GCTTTAAAOT OGAATATACT TGAAATAATT AGTAGAGGTG AGTAAGGATG AGTAATAAAT 
TAGAATCATA CAGAAGTGAG ATTGTATCAC TGAATCATCA AATTTTAGAC TTATTATCTA 
AACQTGGTGA ACTAGCACAA AAAATTGGGG AAGAAAAATT AAAACAAGGT ACACGTATTT 
ATGATCCACA ACGTGAAAAA GAAATGCTTA ACGACTTAAT CGATAGTAAC AAAGGACCAT 
TCAACGATAA TACTATTAAG CAATTATTTA AAGAAATTTT CAAAGCCTCT ACAGATTTAC 
AAAAATCTGA AAATGAAAAA CATTTATATG TATCACGTAA GTTGAAACCT GAAGATACGA 
TTGTAACATT TGATAATGGG GGCATTATAG GAGACGGCAA TAAATCATTT GTATTTGGGC 
CATGTTCAGT TGAATCATTT GAACAAGTTG AAGCTGTTGC TAAAAACTTA CATGCTAAAG 
GTGAAAAATT TATTCGTGGC GGTGCATTTA AACCACGTAC ATCACCATAT GATTTCCAAG 
GCCTAGGTGT TGAAGGACTT AAAATACTTA AACAGATTAA AGATAAATAT GATTTAAATG 
TTGTCAGCGA AATCGTAAAT CCAAATGATT TTGAAGTGGC TGATGAGTAT TTAGACGTAT 



60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
840 
900 
960 
1020 
1080 
1140 
1200 



55 



1152 



EP 0 786 519 A2 

AAAAGCCTAT TCTATTAAAA CGTGGTTTAT CTGCTACAAT CGAAGAGTTT GTTTATGCAG 1320 

CTGAATACAT TGCTTCACAA GGTAATCAAA ACATTATTTT ATGTGAACGT GGAATCCGAA 1380 

^ CTTATGAAAA GGCGACAOGT AACACTTTAG ATATTTCAGC AGTACCAATT TTAAAACAAG 1440 

GTACACACTT ACCAGTCATG GTAGATGTTA CGCATAGTAC AGGTCGTAAA GATATCATGT 1500 

TACCAACTGC GAArsAgCAT TAGCAGTTGG TGCTGATGGA GTTATGGCTG AGGTGCATCC 1560 

AGATCCATCT GTTGCACTTA GTGATGCGGG TCAACAAATG GATTTAGATG AATTCCAAGC 1620 

ATTTTATGAT GAATTAAAGC CTTTAGCTGA TTTATATAAC GCTAAAAAGT TAAAATAATA 1680 

TTCCAAGGAA ACTATAGACT ACTTAACTAA TATGTCATGT TGAAGTAGAA TATTATCTTT 1740 

GAATCGACAA TTTTAAACTT ACAGCCATTC TAAGAGTATA TTACTTTTAG AGTGGCTATT 1800 

ATTrrrTGTA TAGAAATAAA GGTATACTGC ACTTAACGAT TGTTATAATA CTTCGACACT 1860 

20 TGTTCAATTT CACAATTATT AAAGATTATG ACTGATAGCA GTAATTAAAA TTATAACTAT 1920 

GAATTATCTG TAAAATATAA TAGATTCACA CATTTGTTGC TGAAATGTGA ACATTTTTCA 1980 

ACAAATGCAA TTGATATTTG AAAAGGCTTT CTCAAAACAT TACAATTAAA AATGAAAAAA 2040 

2S GTTTATATAA AATTAAAATA TATCGTTCGT TATCATTTAG CGTTTGTTTT TATTTCAAGC 2100 

TTTTCGCTAA ATTTTTCCAA ACAAAAATAT GTTACTGTAA ATTAAAATAT GGTAAACTAT 2160 

GAAAATGAAA TGAAAACATG TTATTATAAT GAATAAAACG TTTACAAGGA GGAAATTATG 2220 

30 

ACAGTTACTA TATATGATGT AGCAAGAGAA GCGCGTGTCT CTATGGCCAC AGTGTCGCGT 2280 

GTTGTTAATG GGAACCAAAA TGTTAAAGCA GAAACTAAAA ATAAAGTTAA CGAAGTCATT 2340 

AAGCGTTTGA ATTATCGTCC AAATGCTGTT GCTAGAGGTT TAGCTAGTAA AAAGACAACA 2400 

3S 

ACAGTAGGTG TGATCATTCC AGATATATCT AATATCTATT ATTCACAACT TGCTCGTGGA 2460 

CTT(»AGATA TTGCAACAAT GTATAAATAT CACTCAATTA TTTCAAATTC AGATAACGAT 2520 

■ 

40 CCTGAAAAGG AAAAAGAAAT TTTTAATAAC TTATTAAGTA AACAGGTTGA TGGTATTATT 2580 

TTCCTTGGTG GTACAATTAC TGAAGAAATG AAAGAATTGA TAAATCAATC ATCTGTACCT 2640 

GTAGTAGTAT CAGGAACAAA TGGTAAGGAT GCACATATAG CATCAGTTAA TATTGATTTT 2700 

ACTGAAGCTG CGAAAGAAAT TACGGGAGAA TTAATTGAAA AAGGCGCTAA ATCATTTGCT 2760 . 

TTAGTAGGTG GAGAACATTC TAAAAAAGCT CAAGAAGATG TTTTAGAAGG TTTAACTGAA 2820 

GTGTTAAATA AAAATGGCCT TCAATTAGGT GATACATTGA ATTGTTCTGG TGCTGAAAGT 2880 

SO 

TATAAAGAAG GCGTAAAAGC TTTTGCCAAA ATGAAAGGCA ATTTGCCAGA TGCCATTTTA 2940 

TGTATCAGCG ACGAAGAAGC AATTGGTATT ATGCATAGTG CA^TGGATGC TGGTATTAAA 3000 

• « 
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CCACAACTTT CTAGTGTTAT TCAACCATTA 
TTAACAAAAT ATATGAACGA TGAAAAGATA 
^ ATTGAATACC GAGGAACTAC AAAATAAATT 

AATTATATGG GTGTTGGAAG AATGCCTTTT 
TTACTTATTG ACGAGTAGAT TCGTACCAAC 
TTTCACTAAT TTCTTTTGTG CGGGGGACAT 
TTTTAGGTAA TAATTCAGAT GAATAATGTT 
AACCACTTTG AATTGGTTGA TCAATTAAAC 

IS 

CGACTCTCCA AATATTGTAG CCTCCGCCAC 
AATCAGCTAA ATATTTTACA AAATATGGAA 
20 GATGAGTTAG TGGATCACGA TAATGTATAT 

GTTTAAAACT CTTTACGACA GGCTCAACTG 
CTTCTGTATA CGGTTCAAGT GGGACATTTA 
GCTCAGTATA GTGACCAGAG CCTGGGAAAA 
TAGTAACATG GTTATCGGCA TAGAAACTCC 

TATCTATGAT TAAAACGCXST TGATTGTATT 

30 

TATCATTGTA TATACAAAAA CCACTTGCTC 

CTAAGTGACA ACCATTTAAT ACTTTGCCTG 

CTCCAACAAT TGTGGCACTA TGGCGGTGCA 

35 

TTAATCCATA TTTCTTAGCC TCATCTTCAC 
CTTCGACGTA ATCATATTTA TGAATTAACA 
40 GTACTATTTG TTCTGGAGAC AATAAATTTG 
AACGCATTTG ATTGAAGGGA TGTTGGTCAT 
AAACATATGC AGTTTTTGAT GAATGTTGTT 
AAAAGAAAAA CCGATTCATA TAACGAATAT 
TGTTTTTGCC AATTCTTGCC ATTAAACAAT 
CTGTAGCGAA TATTTCAAGT CCACCAGTTG 

SO 

CAAATACATC TAACTTTGAA TTTTTTAAAT 
CGATATAATT CTCOAATICT GGTGTAGAAA 
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TATGATATCG GTGCAGTAGG GATGCGCTTA 3X20 

GAAGAACCAA ATGTAGTnT ACCTCACAGA 3180 

CACAAAATTA GGCATTCATC TAACGACCCA 3240 

ATTTATCTTT TAAAATCGTT GCAGATTAGG 3300 

TCGCTATATG TAAAGCTAAT TTTTTATTTT 33^0 

AGGTATAATC ATTTAAACGA TCTTCCCATC 3420 

TCCATTTATT AATCCATTCT AACGGTAAAT 3480 

TTAAGAATAC ATGACTCCAT GCACGTGGTA 3540 

CAAACATAAT TACCTTTCCA TTCGTATAAG - 3600 

TTTCATATAA TGAATGTAAC GTACAATTTA 3 660 

CGACACCATT TACGCTTAGA ATAATATCAG 3720 

TTAATTTAAA ACACTCCAAA AATGATGCAT 3780 

CAGTGTGTCC ATAGCCGATA TCTTCACCGC 3840 

GAAATTTTCC GGTTTCATGG ATAGAATAAG 3900 

ATTGTGTACC ATCTCCATGA TGTGCATCGG 3960 

CTTTAGCTAA GTATTGTGCG GTAATTGCAA 4020 

GACCAGGTTG AGCGTGATGC AAACCACCAC 4080 

ACATAATAAG ATCTGCTAAA GTTAAAGCGC 4140 

TATGCTTAAA TTGACCATTC TCTTCATCAT 4200 

TGATAATGCC ATGTGAAGCA TGCTTAATAG 4260 

TTAATTCGTC ATCTGTTGCA ATTCTAGGTT 4320 

CATTCAAAAG TAGCTCTGTT GTTAATTTTA 4380 

GAAATCGATA TTGTAATAAC TTATCTGAAT 4440 

GCATATAATC CCTCCGATAT TCCAAAAATT 4500 

CATCAAACGC TTGTTGCTGT TCTAATGTAA 4560 

TAGCTGGATG ACTTGTTATT TCIGGATCAT 4620 

CCATTAACCG CTGCATTAAT TTTTTATAGT 4680 

CCCAATGCCA GTAATATTCT GTAGTTATAA 4740 

GGCTAAGTTG TATCAGCTTT TCTGCAAGTT 4800 
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TACCTGTAGA CCAGCGCTCA ATTTCATCAG Cy^TAGTGGAA AGTGACATAA CCCACAATGA 4920 

GTTGATCTTG GCGAGCAACA TAAATTCTAC CTTCTGGTAA TGTTGTAATT TCTAACAAAG 4980 

CTTTATACTG ATCTTCAGCA TCTCTAAATG CGGTTAAATG CGCATCGAAA GTAAGCGCTT 5040 

TCAAATCTtC GTGTGTTAAA GGACCTTCAA TAACAAATTG CTTGTCATGA ATGTAATAAT 5100 

CTTCGGATTG ATACGTCTTT AAATGATTCA TATTTTCAAC TCCTCAATCG ACX3TCGTGAT 5160 

TGTATTAAAT TCATTATATA GAAaATTTAC AATAATTAAT ACTAGAAAAA GGATAAAAGT 5220 

AAAAATTTTG AATAATTAGA AATGTTATGT ATAATATTGA GAAAGAAAGC GTTTTCACAT 5290 

AACAAAGGGG GAGTTTCAAA TGAAAGTCGA AGTTTATAAA GGAGCGCAAG GTAAACATAA 5340 

CCTTAAAGAT TATGAAGAAA CATATAATAC TTTTGATTGG AAAGACGTAG AACAAGCATT 5400 

TTCTTGGAGT GAAACTGGAA AAATGAACAT GGCATATGAA TGCATAGATC GCCATGTAGA 5460 

20 TCAAGGATTA GGGGATAAAA TAGCGTTAAA TTACAAAGAT GAGCACAGAA AAGAATCGTA 5520 

TACTTATAAA GATATGCAAC GGTTATCTAA TAAAGCAGCG AATGTTTTGT CTGAACATGC 5580 

AGAAGTTGAC AAAGGTGACA GAGTATTTAT ATTTATGTCG CGTACACCTG AACTATATTT 5640 

TGCGTTGTTA GGTGTTTTAA AAATTGGTGC AATTGTTGGG CCGTTATTTG AAGCATTTAT 5700 

GGAAAAGGCA GTTGCGGATA GATTAGAGAA CAGTGAAGCT AAAGTGTTAA TTACTAATAA 57 60 

GGCATTGTTA CCTCGAGTAC CTGTAGATAA ATTACCAAAC TTGAAAAAAA TTGTTGTCGT 5820 

AGATGAGGAT GTAGAAGACA ATXACATAGA CTTCATTAGT TTGATGGAAA CTGCTAGGGA 5880 

TGAATTTGAC ATTGAATGGT TAAAGTCGGA TGATGGTTTG ATTTTACATT ATACATCAGG 5940 

TTCTACTGGQ CAACCTAAAG GtGTATTGCA TGTTCAACAA GCAATGTTAG TGCACTATAT 6000 

TTCTGGAAAA TATGTATTAG ATTTACAAGA AGATGATGTT TATTGGTGTA CAGCAGATCC 6060 

AGGTTGGGTT aCAGGAACAT CTTATGGTAT TTTTGCACCA TGGTTAAATG GCGCTACAAA 6120 

40 TTGTATAGCT GGTGGTCGCT TTTCGCCAGA ACAGTGGTAT AGTATGATTG AAGATTTTAA 6180 

•AGTGACGATT TGGTATACGG CACCAACAGC TTTAAGAATG TTAATGAGTG CTGGTGACGA 6240 

TATTGTTGAG AAATATGACT TGTCATCGTT ACGTTCGATT CTATCAGTAG GTGAGCCTTT 6300 

AAATCCTXy^_ GTTATAAAAT GGGCGAAAAA AGTATACGGT TTAACGGTGT. TAGATACT^ 6360 

GTGGATGACA GAAACAGGTG GACATATGAT TGTTAACTAT CCAACGATGG ACGTcAAGCT 6420 

TGGCTCAATG GGCAAACCAT TACCTGGTAT TCAAGCTGCA ATTATCGATG ATGCAGGGAA 6480 

TGAATTACCA CCAAATCGAA TGGGCAACCT TGCTATAAAA AAAGGCTGGC CATCAATGAT 6540 

GTATCGTATC TGGAAGAATC CAGAAAAATA TAAATCATAT TTTATrGGAG ACTGGTATGT 6600 
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TGATGTAATT ATGACAGCTG GTGAACGAGT TGGACCATTT GAGGTTGAGT CTAAATTGGT 
TGAACACGAA GCAGTTGCCG AAGCAGGAAT TATTGGTAAA CCTGATCCGG TTCGCGGTGA 
AATAATTAAG GCGTTTGTTG CACTGAGAAA AGGATATGAA CCAACAGACG AATTAAAAGA 
AGAAATTCGT ATATTTGTTA AAGAAGGTTT GTCGGCACAT GCAGCACCAC GTGAAATCGA 
ATTTAAAGAT AAATTACCTA AAACACGGTC AGGTAAAATT ATGAGACGTG TATTAAAAGC 
TTGGGAATTA AATTTAGATG CTGGGGATTT AAGTACAATG GAATAATGAC ATGAATGTTA 
TTGAAGATTT TTTTCGAAGA ATAAAGGGTG ACAACATATT TCATGTCAAT GTTTAAATAA 
TCGTTTACTT TACGATAAGC AATATAAAGA ACTGTTAACT TGTGTCATAT CATTTCGTAG 
AAAGCATTTG AAAATGATGA CATAACAATA ATGGCATATC TTTATATTGC TTTTTATTTT 
TAATATGATC TTTGGAAGAT GATTATTTTA AATAATAGAA AAATATAGTT ATCAATAGTA 
TCAA6CGCTA AAAGTTGTAT AATACAAAAC TTTAATAAGT GAATTTATTG CAAAAATGAA 
AGCGCTAACC CGATTTAGTC GACAAGTTTT . TAACAGTTCG TTATTATATG AATGTAAGTA 
AAAATTTCTT AGCTACAACT TACATATTAT AAATGCATAA ATTAAACAAA AAGGGGCGAA 
AAAAGTTGAC TCATTTATCA GATTTAGATA TTGCGAATCA ATCAACACTA CAACCAATTA 
AGGATATTGC TGCATCAGTA GGTATTTCAG AGGATGCATT AGAACCTTAT GGTCATTACA 
AAGCTAAAAT CGACATTAAT AAAATTACGC CAAGAGAAAA CAAAGGGAAA GTTGTTTTAG 
TAACTGCGAT GAGCCCAACA CCAGCTGGTG AAGGTAAATC AACGGTTACA GTTGGTTTAG 
CTGATGCATT CCATGAGTTA AATAAAAACG TTATGGTTGC ATTAAGAGAG CCTGCTTTAG 
GACCAACATT TGGTATCAAA GGTGGTGCGA CTGGTGGTGG TTATGCGCAA GTCTTACCTA 
TGGAAGATAT CAACTTACAT TTCAACGGAG ATTTCCATGC GATTACAACT GCAAATAATG 
CATX^TCTGC GTTTATCGAT AATCATATTC ACCAAGGTAA CGAATTAGGA ATCGATCAAA 
GACGTATTGA GTGGAAACGT GTATTAGATA TGAATGATCG TGCACTTAGA CATGTAAACG 
TTGGGTTAGG TGGACCTACA AATGGTGTAC CACXJTGAAGA TGGCTTTAAT ATTACAGTAG 
CGTCTGAAAT TATGGCGATT TTATGTTTAA GTAGAAGTAT TAAAGACTTA AAAGATAAAA 
TTAGTCGTAT TACTATTGGT TACACTAGAG ATCGCAAGCC AGTTACAGTT GCAGATTTAA 
AAGTGGAAGG. TGCACTTGCA .ATGATTTTAA AAGATGCAAT AAAACCAAAC TTAGTACAAT 
CAATTGAAGG GACACCTGCA TTAGTTCATG GTGGACCATT TGCGAATATC GCACACGGTT 
GTAACTCAAT TTTAGCAACT GAAACAGCAC GTGATTTAGC TGATATCGTT GTAACGGAAG 
CTGGATTTGG TTCAGACTTA GGCGCTGAAA AATTCATGGA CATTAAAGCG CX5TGAAGCAG 
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GTGTAGCGAA AGATAATTTA AAAGAAGAAA ATGTAGAAGC AGTAAAAGCA GGAATTGTTA 8520 

ATTTAGAGCG TCATGTTAAT AATATTAAAA AATTCGGTGT AGAACCGGTT GTTGCAATTA 8580 

ATGCATTTAT ACATGATACC GATGCAGAAG TAGAATATGT AAAATCTTGG GCTAAAGAAA BS40 

ATAACGTACG AATTGCCTTA ACTGAAGTTT GGGAAAAAGG TGGTAAAGGT GGCGTTGACT 8700 

TAGCAAATGA AGTATTAGAA GTCATTGATC AACCTAATTC ATTTAAACCT TTATATGAAT 8750 

TAGAATTACC ATTAGAGCAA AAGATTGAAA AGATTGTGAC TGAAATCTAT GGCX3GTTCAA 8820 

AAGTAACX3TT TAGCAGTAAA GCGCAAAAAC ' AATTAAAACA ATTTAAAGAA AATGGTTGGG 8880 

ATAATTACCC A6TATGTATG GCGAAAACAC AATATTCATT CTCAGATGAT CAAACXSTTGT 8940 

TAGGTGCACC ATCAGGATTT GAAATTACAA TTCGTGAATT AGAAGCGAAA ACAGGTGCAG 9000 

GATTTATCGT AGCGTTGACA GGTGCAATCA TGACTATGCC TGGTTTACCT AAAAAACCAG 9050 

CAGCATTAAA CATGGATGTT ACTGATGATG GTCATGCAAX TGGGTTATTC TAATAAATCA 9X20 

• " * .- 

TGTCAATTGT TTAATAAAGA TAAGTAAATA GTTTAATAGA CCGGACTGTT GGAGATGCAT 9180 

TATTTCAGCA GTTCGGTTTT TTGCTGTGCT AAAAATAGAT TCAATTTGGC GAATCTAACG 9240 

ACAATGTTTG AAGGTGGTTA ATTAATGTAT ATGAAGATAA AAAGTGGGCT TGAAGAATAG 9300 

GAAAGCGATG CAATGAATAT TCCATATTAA AAAAAATTAA TAAAATAGGT TGCAATATTT 9360 

. - ■ - - • 

AATTGGGATG CGCTACAATT AACACTAATA ATTGATATTG ATAATTATTA TCAATTAAAT * 9420 

ATAATCTTAT AGGAGTTGTT AACAACATGA ACAAACATCA CCCAAAATTA AGGTCTTTCT 9480 

ATTCTATTAG AAAATCAACT CTAGGCGTTG CATCGGTCAT TGTCAGTACA CTATTTTTAA .9540 

TTACTTCTCA ACATCAAGCA CAAGCAGCAG AAAA7ACAAA TACTTCAGAT AAAATCTCGG 9600 

AAAATCAAAA TAATAATGCA ACTACAACTC AGCCACCTAA GGATACAAAT CAAACACAAC 9660 

CTGctACGCA ACCAGCAAAC ACTGCGAAAA ACTATCCTGC AGCGGATGAA TCACTTAAAG 9720 

ATGCAATTAA AGATCCTGCA TTAGAAAATA AAGAACATGA TATAGGTCCA AGAGAACAAG 9730 

TCAATTTCCA GTTATTAGAT AAAAACAATG AAACGCAGTA CTATCACTTT TTCAGCATCA ' 9840 

AAGATCCAGC AGATGTGTAT TACACTAAAA AGAAAGCAGA AGTTGAATTA GACATCAATA 9900 

CTGCTTCAAC ATGGAA6AAG TTTGAAGTCT ATGAAAACAA 7CAAAAATTG* CCAGTGAGAC 9960 

TTGTATCATA TAGTCCTGTA CCAGAAGACC ATGCCTATAT TCGATTCCCA GTITCAGATG 10020 

GCACACAAGA ATTGAAAATT GTTTCTTCGA CTCAAATTGA TGATGGAGAA GAAACAAATT 10080 

ATGATTATAC TAAATTAGTA TTTGCTAAAC CTATTTATAA CGATCCTTCA CTTGTAAAAT 10140 

CAGATACAAA TGATGCAGTA- GTAACGAATG ATCAATCAAG TTCAGTCGCA AGTAATCAAA 10200 
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AGGCAACGAC CAATATGAGT CAACCTGCAC AACCAAAATC GTCAACGAAT GCAGATCAAG 10320 

CGTCAAGCCA ACCAGCTCAT GAAACAAATT CTAATGGTAA TACTAACGAT AAAACGAATG 10380 

AGTCAAGTAA TCAGTCGGAT GTTAATCAAC AGTATCCACC AGCAGATGAA TCACTACAAG 10440 

ATGCAATTAA AAACCCGGCT ATCATCGATA AaGAACATAC AGCTGATAAT TGGCGACCAA 10500 

TTGATTTTCA AATX3AAAAAT GATAAAGGTG AAAGACAGTT CTATCATTAT GCTAGTACTG 10560 

TTGAACCAGC AACTGTCATT TTTACAAAAA CAGGACCAAT AATTGAATTA GGTTTAAAGA 10620 

CAGCTTCAAC ATGGAAGAAA TTTGAAGTrT ATGAAGGTGA CAAAAAGTTA CCAGTCGAAT 10680 

TAGTATCATA TGATTCTGAT AAAGATTATG CCTATATTCG TTTCCCAGTA TCTAATGGTA 10740 

CGAGAGAAGT TAAAATTGTG TCATCTATTG AATATGGTQA GAACATCCAT GAAGACTATG 10800 

ATTATACGCT AATGGTCTTT GCACAGCCTA TTACTAATAA CCCAGACGAC TATGTGGATG 10860 

AAGAAACATA CAATTTACAA AAATTATTAG CTCCGTATCA CAAAGCTAAA ACGTTAGAAA 10920 

GACAAGTTTA TGAATTAGAA AAATTACAAG AGAAATTGCC AGAAAAATAT AAGGCGGAAT 10980 

ATAAAAAGAA ATTAGATCAA ACTAGAGTAG AGTTAGCTGA TCAAGTTAAA TCAGCAGTGA 11040 

CGGAATTTGA AAATGTtACA CCTACAAATG ATCAATTAAC AGATTTACAA GAAGCGCATT 11100 

TTGTTGTTTT TGAAAGTGAA GAAAATAGTG AGTCAGTTAT GGACGGCTTT GTTGAACATC 11160 

CATTCTATAC AGCAACTTTA AATGGTCAAA AATATGTAGT GATGAAAACA AAGGATGACA 11220 

GTTACTGGAA AGATTTAATT GTAGAAGGTA AACGTGTCAC TACTGTTTCT AAAGATCCTA 11280 

AAAATAATTC TAGAACGCTG ATTTTCCCAT ATATACCTGA CAAAGCAGTT TACAATGCGA 11340 

TTGTTAAAGT CGTTGTGGCA AACATTGGTT ATGAAGGTGA ATATCATGTC AGAATTATAA 11400 

ATCAGGATAT CAATACAAAA GATGATGATA CATCACAAAA TAACACGAGT GAACCGCTAA 11460 

ATCIACAAAC AGGACAAGAA GGTAAGGTTG CTGATACAGA TGTAGCTGAA AATAGCAGCA 11520 

CTGCAACAAA TCCTAAAGAT GCGTCTGATA AAGCAGATGT GATAGAACCA GAGTCTGACG 11580 

TGGTTAAAGA TGCTGATAAT AATATTGATA AAGATGTGCA ACATGATGTT GATCATTTAT 11640 

CCGATATGTC GGATAATAAT CACTTCGATA AATATGATTT AAAAGAAATG GATACTCAAA 11700 
TTGCCAAAGA TACTGATAGA AATGTGGATA AAGATGCCGA TAATAGCGTT GGTATGTCAT . 11760 

CTAATGTCGA TACTGATAAA GACTCTAATA AAAATAAAGA CAAAGTCATA CAGCTGAATC 11820 

... • 

ATATTGCCGA TAAAAATAAT CATACTGGAA AAGCAGCAAA GCTTGACXSTA GTGAAACAAA 11880 

ATTATAATAA TACAGACAAA GTTACTGACA AAAAAACAAC TGAACATCTG CCGAGTGATA 11940 

TTCATAAAAC TGTAGATAAA ACAGTGAAAA CAAAAGAAAA AGCCGGCACA CCATCGAAAG .12000 
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CATGGTGGGG CTTATATGCG TTATTAGGTA TGTTAGCTTT ATTCATTCCT AAATTCAGAA 
AAGAATCTAA ATAATTAnCT AAATATAGCA TATGTATGAT TAACTTTGTA GAC 
(2) INFORMATION FOR SEQ ID NO: 311: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH; 13X6 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



12120 
12173 



15 



20 



2$ 



30 



35 



40 



45 



50 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 311: 
CAACATTAAT ATTGATATTA AATCTTCCTG GATAACGTGC TTGTTCGAGT GATAAGTATG 
CACGCACTTG ACTTAACTCT TTATCTAAAG TAATCGTATG TTGCTTAGAG CCTTGTAAAT 
TCGCTCTGAA AAAATAACTC AATTCTAATA GTAACTCTCG TGCCTTTTCG CTATTTATTC 
TAACTAAAGC TGAGATCGTG TTAATTGAAT TGAAGAAAAA ATGTGGACTC ACTTGTGCCT. 
GTAATGACTT AATCTCAGCA TCTTTCAATA ACTTACTTTG CGTTTCGGCT TCACCAAGTT 
CAATTTGGCT ACTAAAAATA TTTGCCAATC CtTCTGCAAG TTGACGTTCC ACAAAAGTTA 
AATCATTAGG GTTTGTAAAA TACATCTTCA ATGTACCGAC 6ATAGAACCA TGCATCTCAA 
GTGGTATCAC GATAGCTGCT CTAAGCGGGC AATTCGGATG ACTACAACCA ATCTCTTCTT 
TAGTATGAAC TTCTTTCAAC TTTCCTGATT TCAATACATC TTTAGACAGA CTTGTTAATA 
TTTCATTTGT TG6TATGTGA TGATCACTAC CTGCACCTAC ATGCGATAAG ATTTCATTTT 
TGCTTGTAAT TGCTACGGCA GATACTTTCA TTAAATTTTT AATAATCATC GCAATTTGCT 
GTGCCGATTC TCTATTCAAT CCTTCTTTAA AATACGGCAA TGTCTGGTTC ATCAATTGCA 
GTAC3VTCATG TGTTTGAACA GCCTTCATTT GCTCCTCTTG CTTTAATGTT GAAATGATAA 
TAGACATAAA AATCGCCGTA CCAACGCTAT TAACAATAAT CATTGGTAGT GCAATTAATG 
ATATGAGGTC AACCGCATAT GCTTTGTCGT GGGAAAATGT TAAAATGCTC AACATTTGAA 
TCATTTCCAT AACAATTCCA ATCATGGCAC TTTTCGCAAT ACTCGGGTAA CGCTTGCGTC 
TTTGAGCTTG TAAGCCAAAA TAACCAGCAA TTATACCAAT AAATATAGAT GAGATAAGAT. 
AAACTTGTGC ATCCGCCCCA CCCATATACA CTCTGAAAAT ACCTGAAATA ACGCCAACAA 
ATAGACCTAC AAAAGGGCCA CCAACTAATC CTGCGACACC TATCGTTAAT ACACGTGTGT 
TAGCTAAAGA TACATCATCA TCTAAACGGA AGTACACACT TCCTGACAAA CTATGTTGAT 
GATCGATGAC GATACCAGTT AAATTAGACA TTAAGGCAAA CAAACTGAAA ATAATACATA 
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(2) INFORMATION FOR SEQ ID NO: 312: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 7972 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNE5S : double 

(D) TOPOLOGY: linear 



10 



IS 



20 



25 



30 



35 



40 



45 



SO 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 312: 
TATAAATATT ATTTTATTAT CGTTTATCGC TATTTGTGTT ACATAATCAA AACCATAAAT 
TCTTACTCAT TCAGATTTAC CCAATATTTT, TACTTTTATA ATGTAATGCG TTTTATCCAA 
GTTATTTrrr AAAAATAAAT ATTGAATTnG GGGCTGnTTT CATGTCATTA AGAGATGAAG 
CATTGGAAAT GCACAAACGT AATCAAGGTA AATTAGAAGT TAAACCAAAT GTAAAAGTTA 
CTAATAAAGA QGAATTAAGT TTAGCATACT CACCTGGCGT TGCT6AACCG TGTAAAGATA 
TTTATGAAGA TAAAAGAAAA GTATATGATT ACACAATTAA AGGAAATACA GTTGCAGTTA 
TTACTGATGG AACAGCGGTA TTAGGTTTAG GTAACATTGG ACCTGAAGCA AGTATTCCTG 
TAATGGAAGG TAAAGCAGTA TTATTCAAAA GCTTCGCTGG TATCAATGGG GTGCCTATTG 
CGTTAAATAC AACTGATACC GAAGAAaTCA TTAAAACAGT TAAGTTGTTA GAACCTAATT 
ATGGTGGTAT TAATTTAGAG GATATTTCGG CACCACGTtG TTTTGAAATT GAAGAACGAT 
TGAAAAAAGA AACTAATATT CCGGTATTCC ATGACGATCA ACATGGTACA GCAATTGTAA 
CATTGGCAGG TTTGGTAAAT GCATTGAGAG TTGTTAACAA AGATATTGCT AAAATAAAAG 
TTGTACTAAA TGGTGCTGGT GCAGCAGGAA TAGCCATTGT TAAATTACTA TACGCGTATG 
GTGTAAGAAA TATGGTTATG TGTGACTCAA GAGGCGCAAT TTTTGAAGGA CGTTCATATG 
GTATGAATCC TACGAAAGAT GTTGTAGCAA AATGGACAAA TAAAGATAAG ATTGAAGGGT 
CTTTAGAAGA AGTCGTAAAA GACGCAGATG TATTTATCGG GGTTTCTGTA GCTAATGCGC 
TGTCACAAGA TATGGTTAAG AGTATGGCAG ATAATCCAAT TATATTTGCA ATGGCTAATC 
CAAATCCTGA AATAATACCT GATGATGCCA AAGCGGCAGG TGCACGAGTT GTTGGTACAG 
GACGTTCAGA CTATCCTAAC CAAATTAATA ATGTATTAGC TTTCCCTGGT ATTTTTAGAG 
GTGCATTAGA GGTTGAAGCT ACACATATAA ATGAAGAAAT GAAAAAGGCA GCTGTAGAAG 
CGATTGCTGA TTTAATCGAT AGTTCTGAAT TAAATGAAGA CTACTGTATC CCAGGACCGT 
TTGATAAACG TGTAGCGCCA TCAGTTGCTC GTAATGTTGC TAAAGCGGCA ATGGAATCTG 
GAGTAGCTAG GATTCAAGTT GATCCGCAAG ATGTGTATGA TAAAACAATG AAACTTACAG 
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ATTAAAATGA TGAAAATGAA AGTTTATGAT AAACATTCAA CAGTCAAAOG AATATAAATC 
AAATAAATTT AAACCCGTTT TTAACTCX5TC AAGTTCAGTT TAAGGCTCTA AATGGTTAGA 
ACAGAGGTTA TTTGGAGGTT TTCCTATGTT TAAAGATTTT TTTAATCGAA CAAAGAAAAA 
GAAATATCTT ACAGTACAAG ACTCTAAAAA TAATGATGTG CCTGCAGGTA TTATGACTAA 
GTGTCCAAAG TGTAAGAAAA TTATGTACAC AAAAGAATTA GCTGAAAATT TAAATGTGTG 
CTTTAATTGT GATCATCATA TTGCTTTAAC TGCGTATAAA CGTATAGAAG CAATTTCTGA 
TGAAGGATCA TTTACAGAAT TCGATAAGGG AATGACCTCT GCGAATCCAT TAGATTTTCC 
aAGTTATTTA GAAAAAATTG AAAAGGACCA ACAAAAGACA GGTCTTAAAG AAGCAGTTGT 
GACTGGTACA GCACAACTAG ATGGTATGAA ATTTGGCGTT GCTGTCATGG ATTCACX3TTT 
TAGAATGGGA AGTATGGGAT CGGTTATCGG TGAAAAGATA TGXC6CATCA TTGATTACTG 
CACTGAGAAC CGTTTACCAT TTATTCTTTT CTCTGCAAGT GGTGGTGCAC GTATGCAAGA 
AGGTATTATT TCCTTGATGC AAATGGGTAA AACCAGTGTA TCTTTAAAAC GTCATTCTGA 
CGCTGGACTA TTATATATAT CATATTTAAC ACATCCAACT ACTGGTGGTG TATCTGGAAG 
TTTTGCATCA GTTGGTGATA TAAATTTAAG TGAGCCAAAA GCGTTGATAG GTTTTGCAGG 
TCGTCGAGTT ATTGAACAGA CAATAAACGA AAAATTGCCA GATGATTTCC AAACTGCAGA 
ATTTTTATTA GAGCATGGAC AATTGGATAA AGTTGTAGAT CGTAATGATA TGCGTCAAAC 
ATTGTCTGAA ATTCTAAAAA TCCATCAAGA GGTGACTAAA TAATGTTAGA TTTTGAAAAA 
CCACTTTrTG AAATTCGAAA TAAAATTGAA TCTTTAAAAG AATCTCAAGA TAAAAATGAT 
GTGGATTTAC AAGAAGAAAT TGACATGCTT GAAGCGTcAT TGGAACGAGA AACTAAAAAA 
ATATATACAA ATCTAAAACC ATGGGATCGT GTGCAAATTG ' CGCGTTTGCA AGAAAGACCT 
ACGACCCTAG ATTaTATTCC ATATATCTTT GATTCGTTTA TGGAACTACA TGGTGATCGT 
AATTTTAGAG ATGATCCAGC AATGATTGGT GGTATTGGCT TTTTAAATGG TCXSTGCTGTT 
ACAGTTaTTG GACAACAACG TGGAAAAGAT ACAAAAGATA ATATTTATCG AAATTTTGGT 
ATGGCGCATC CAGAAGGTTA TCGAAAAGCA TTACGTTTAA TGAAACAAGC TGAAAAATTC 
AATCGTCCTA TCTTTACATT TATAGATACA AAAGGTGCAT ATCCTGGTAA AGCTGCTGAA 
GAACGTGGAC AAAGTGAATC TATCGCAACA AATTTGATTG AGATGGCTTC ATTAAAAGTA 
CCAGTTATTG CGATTGTCAT TGGTGAAGGT GGCAGTGGAG GTGCTCTAGG TATTGGTATT 
GCCAATAAAG TATTGATGTT AGAGAATAGT ACTTACTCTG TTATATCTCC TGAAGGTGCA 
GCGGCATTAT TATGGAAAGA CAGTAATTTG GCTAAAATTG CAGCTGAAAC AATGAAAATT 
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GGTGCACATA AAGATATTGA ACAGCAAGCT TTAGCTATTA AATCAGCGTT TGTTGCACAG 
TTAGATTCAC TTGAGTCATT ATCACGTGAT GAAATTGCTA ATGATCGCTT TGAAAAATTC 
AGAAATATCG GTTCTTATAT AGAATAATCA ACTTGAGCAT TTTTATGTTA AATCGATACT 
GGGTTTTACC ATAAATTGAA GTACATTAAA ACAATAATTT AATATTTAGA TACTGAATTT 
TAACTAAGAT TAGTAGTCAA AATTGTGGCT ACTAATCTTT TTTTAATTAA GTTAAAATAA 
AATTCAATAT TTAAAACGTT TACATCAATT CAATACATTA GTTTTGATGG AATGACATAT 
CAATTTGTGG TAATTTAGAG TTAAAGATAA ATCAGTTATA GAAAGGTATG TCGTCATGAA 
GAAAATTGCA GTTTTAACTA GTGGTGGAGA TTCACCTGGA ATGAATGCTG CCGTAAGAGC 
AGTTGTTCGT ACAGCAATTT ACAATGAAAT TGAAGTTTAT GGTGTGTATC ATGGTTACXA 
AGGATTGTTA AATGATGATA TTCATAAACT TGAATTAGGA TCAGTTGGGG ATACGATTCA 
GCGTGGAGGT ACATTCTTGT ATTCAGCAAG ATGTCCAGAG TTTAAGGAGC AAGAAGTACG 
TAAAGTTGCA ATCGAAAACT TACGTAAAAG AGGGATTGAG GGCCTTGTAG TTATTGGTGG 
TGACGGTAGT TATCXSCGGTG CACAACGCAT CAGTGAGGAA TGTAAAGAAA TTCAAACTAT 
CGGTATTCCT GGTACOATTG ACAATGATAT CAATGGTACT GATTTTACAA TTGGATTTGA 
CACAGCATTA AATACGATTA TTGGCTTAGT CX^ACAAAATT AGAGATACTG CGTCAAGTCA 
CGCACGAACA TTTATCATTG AAGCAATGGG CCGTGATTGT GGAGATCTAG CATTATGGGC 
TGGATTATCA GTTGGTGCTG AGACAATTGT AGTTCCAGAA GTGAAAACAG ATATTAAAGA 
AATAGCTGAT AAAATTGAAC AAGGTATTAA ACGTGGTAAG AAACACTCAA TCGTTCTTGT 
AGCAGAAGGT TGTATGACTG CGCAAGATTG XCAAAAAGAA TTATCACAAT ACATCAATGT 
TGATAATAGA GTGTCTGTGT TAGGTCACGT TCAACX3TGGT GGTAGCCCAA CAGGTGCGGA 
TAGAiTTTTA GCATCACGTT TAGGTGGATA TGCGGTAGAC TTATTAATGC aAGGTGAAAC 

a 

AGCTAAGGGT GTTGGAATTA AGAACAATAA AATTGTAGCA ACATCTTTTG ATGAAATTTT 
•TGATGGTAAA GATCATAAAT TTGATTATAG TCTATATGAA CTTGCTAACA AGTTATCTAT 
ATAAGATTTC AGGAGGAATT ATAAAATGAG AAAAACTAAA ATTGTATGTA CAATTGGACC 
AGCTTCAGAA TCAGAAGAAA TGATTGAGAA ATTAATCAAT GCTGGTATGA ACGTTGCACG 
ATTAAACTTT TCACATGGTA GTCATGAAGA GCATAAAGGT AGAATTGATA CAATTCOTAA 
AGTAGCTAAA AGATTAGACA AAATTGcAGC AATTTTATTA GATACAAAAG GTCCAGAAAT 
TCGTACGCAT AATATGAAAG ACGGTATCAT TGAACTTGAA CGTGGCAACG AAGTTATTGT 
TAGCATGAAT GAAGTTGAAG GAACACCTGA AAAGTTCTCA GTAACATATG aAAACTTAAT 
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TAAAGATATT GACCATGCTA AAAAAGAAGT..TAAATGTGAT ATTTTAAACT CTGGTGAGCT 5X00 

TAAAAACAAA AAAGGTGTTA ACTTACCTGO CGTAAGAGTA AGTTTACCTG GTATTACAGA 5160 

AAAAGATGCT GAAGATATCC GTTTCGGTAT TAAAGAAAAT GTTGACTTCA TTGCAGCAAG 5220 

TTTCGTACGT CGTCCTAGTG ATGTTTTAGA AATTCGTGAA AmTAGAAG AACAAAAAGC 5280 

TAACATTTCA GTATTCCCTA AAATTGAAAA CCAAGAAGGT ATTGATAATA TTGCGGAAAT 5340 

TCTTGAAGTG TCTGATGGTT TAATGGTTGC ACGTGGTGAC ATGGGTGTTG AAATTCCACC 5400 

TGAAAAAGTA CCAATGGTTC AAAAAGATTT AATCAGACAA TGTAACAAAT TAGGTAAACC 5460 
AGTTATTACA GCTACACAAA TGTTAGATTC TATGCAACGT AACCCACX5TG CTACACGTGC . 5520 

AGAAGCTAGT GACGTTGCCA ACGCAATCTA TGATGGTACA GATGCAGTAA TGTTATCTGG 5580 

TGAAACTGCT GCTGGTTTAT ATCCTGAAGA AGCTGTTAAA ACAATGAGAA ATATTGCTGT 5640 

20 ATCAGCTGAA GCAGCCCAAG ATTACAAAAA GTTATTGTCA GATCGTACTA AATTAGTTGA 5700 

AACTTCATTA GTGAATGCTA TCGGTATTTC GGTTGCACAT ACAGCTTTAA ACTTAAATGT 5760 

TAAAGCAATT GTAGCTGCTA CTGAAACTGG TTCAACGGCA CGTACTATCT CCAAATATCG 5820 

TCCACATTCA GACATTATTG CQGTGACTCC AAGTGAAGAA ACTGCACGTC AATGTTCAAT 5880 

TGTTTGGGGA GTTCAACCTG TAGTTAAAAA AGGACGTAAG AGTACAGATG CATTGTTAAA 5940 

CAATGCAGTT GCAACAGCTG TTGAAACTGG TAGAGTATCT AATGGTGATT TAATCATTAT 6000 

TACTGCTGGT GTACCAACTG GTGAAACTGG AACTACTAAT ATGATXSAAAA TCCACCTAGT 6060 

TGGTGACGAA ATTGCTAATG GTCAAGGTAT TGGACGTGGA TCAGTTGTTG GTACTACGTT 6120 

AGTTGCTGAA ACTGTTAAAG ATTTAGAAGG TAAAGATTTA TCTGACAAAG TTATCX3TTAC 6180 

TAACTCAATC GATGAAACGT TTGTACCTTA TGTAGAAAAA GCTTTAGGCT TAATTACAGA 6240 

AGAAAATGGT ATTACATCAC CAAGTGCAAT TGTTGGTTTA GAAAAAGGTA TTCCAACAGT 6300 

40 TGTAGGTGTA GAAAAAGCTG TTAAAAACAT AAGCAATAAC ATGTTAGTTA CGATTGATGC 6360 

TGCTCAAGGT AAAATCTTTG AAGGATATGC AAACGTACTA TAATTTATAA AAAAACGTCT 6420 

TTCCATTTAT CAACAATGGA AAGGCGTTTT TTGGTTcATC TGGTATTTTA TGACGTAATT 6480 

AATAGGTTAT TTGATAATGA TAGTGTATGA ATGGCAATCT ATATAAATGT TTATATCTTT 6540 

TATACATGTA CATTATCACC TTCAAACTTT CACTCATATT ACTTTGGAAA TTTATTATAA 6600 

AATAGAAGTA TGGATGTATT TCTGAAATGA TACATTATTA AATAGATGAG AAAGTAAAAG 6660 

TTTTGAGCCA AGTACGCAAT TTAATATTAT AAGTTGCATA TAAAACAGGA TGGGACATAA 6720 

ATCCCTAAAA AAACAGCAGT AAGATAATTT TCAATTAGAA AATATCTTAC TGCTGTTCTC 6780 
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GCACTGCTCC 


CTCAGGAGTC 


TCGCCATTAA 


TACTACGTAT 


TAACATGTAA 


6900 


ACATACl-lTA 


AAAAAATAAA 


ACACTTTGCC 


CAACTTGCAC 


ATAAATGTAA 


6960 


AATGAATTTT 


CTGTGTTGGG 


TCCCTTCGTA 


TAATTTAATA 


AATACCACTA 


7020 


AC6AGGTGCC 


TTATGTATAA 


AATTTATAAC 


* * 

ATGACCCAAC 


TTACACTACC 


7080 


TCTGTTAGAA 


TTCCTCAAAA 


TGATATTTCG 


CX3ATATGTTA 


ATGAAATTGT 


7140 


CCTGATAGCG 


AATTCGATGA 


ATTCAGACAT 


CATCGTGGCG 


CAACATCCTA 


7200 


ATGATGTTAA 


AAATCATCTT 


ATATGCATAT 


ACTCAATCTG 


TATTTTCTGG 


7260 


GArAAATTAC 


TTCATGACAG 


TATTCGAATG 


ATGTGGTTAG 


CTCAAGATCA 


7320 


TATAAAACTA 


TTAATCGTTT 


TAGAGTGAAT 


CCTAATACTG 


ATGCGTTAAT 


7380 


TTTATTCAGT 


TCCATAGTCA 


ATGTTTAAAG 


CAAAATCTTA 


TTGATAATAA 


7440 


ATTGATGGTA 


CAAAAGTAGA 


AGCTAATGCC 


AATAGATATA 


CATTTGTGTG 


7500 


ATTCAAAATC 


ACGAATCGAA 


ATTGAACGAA 


AATTCAAAAA 


CATTATATCG 


7560 


GAAGAAAAAA 


TAATACCAGA 


GATAAAAGAA 


GATGGAGATA 


GCGATTTAAC 


7620 


ATAGATTTAA 


TTGGTAGTCA 


TTTAGATAAA 


GAAATCGAAG 


ATTTAAATCA 


7680 


AACGAAGATT 


GTGCTCAAAT 


TAGAAAACAG 


ACCCGTAAAA 


AAATAACTGA 


7740 


rrCAAAAAGA 


AATTTGATGA 


TTATTCCGAA 


AGAAAAAATA 


AATATGAAGA 


7800 


ATTCTTAAAG 


ATAGAAATAG 


TTTTTCTAAA 


ACTGATCTGA 


TCATGATGCA 


7860 


GAATGAAGGA 


AGACCATATG 


AAAAATGGCC 


AACTTAAGCC 


AGGATACAAT 


7920 


CGACAAATTC 


TCAAAAATGT 


TTTATCCTAT 


GACCTATTTC 


AA 


7972 



(2) INFORMATION FOR SEQ ID NO: 313 i 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3175 base pairs 
40 (B) TYPE: nucleic acid 

(C) STRANDEDNBSS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 313: • 

ATTTTTTAGT TAATTGTCTT TCTTAAAATA ATTTTAGCTT TCATTAAATT AAACAATTTT 60 

ACAAGCTTGG AACACCAATC AAAATCCTAA GTTCTAAAAT GCAATATTAG TAGTCGTTGA 120 

CTGAATGAAC ATATGCTTAT AATATTTTTT TGCAATGCTA GTCAAGTTGA TTTATGCTCA' 180 

CAAGGATATG CGATTTATAT TTTCTTACAA CAATGAAAAT GCCTGATACA ATGCGATCCT 240 
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AATTAAATTA TTGTTGTTTT AACCATTGTA CTATCGTCGG AATCATAAAT CCTGTTGGCC 
CTTTTGGACC ATTATATGAA GCTTTATTAG TCGTTGCTGG ACCTGCAATA TCGAAATGAA 
TGTGAGGTGT TTGACCACTA AAATGTGTTA CAAAACTTGC CGCAAATAGC GCTTTACCTT 
GTCCATTCGT ATGGTTAACT AAATCAGCGA TATCACTGTG TTTAATACTT GCACGTTCGG 
TTGCAGTAAT CGGTAATTCA AATACCATTT CATCGACTTC AGAACTTATT TGTAATATAT 
CGTTTAATAT CACTTTACTA TTCGATTCAA ATGCAGCAGC TTTATCATCG CCTAGTGCAa 
CAATTGCTGC ACCCGTTAAT GTAGCAAAGT CCATAATCAC ACTAGGCTGA TATTGATTTG 
CATAAAACAC AGCATCTGCA AGGACTAATC TACCTTCAGC GTCTGTATTC ATTACTTCTA 
CAGTTTCACC ACTTAATGCT GTAAATACAT CATCTGGcTT CATTGATGCT TCATTTATCA 
TATTTTCAGC ACACGCAAGC ACTCCGACAA TATTTACAGG CAGTTGTAAA CGAcTAGCCG 
CTTCAATGAT ACCAACGACA TTCGCAGCGC CACACATGTC AAACTTCATT GTAGCCATGC 
CATTCTTCX3T TTTAATACTA TAACCACCAG AATCATACGT TATACCTTTA CCAACTAAGG 
CAATTGGTGC TTCATCTTTG TCTTTGCCAT TATATGTGAT GGTTACTAAt CTCGGTTTAT 
GCTTACTACC TTTACCTACT GCTTGTAAAA GTCCGAATCC TTCAGAAACT AAAGTGTCAT 
AATCTTTAAC ATCTACTTTG ACCTTTGTAT TTTTAAAATG ATTAACAATA TCTTCTGcAA 
ATGTTTGTGG TGtTAATACA TTCGGTGGCA TATTACTAAA GTCTCyTGcC AAATTAATGG 
aTTGGcCAAT ACTGATACCC TCATGAATAA AATCTAATTC AATTAATGAT TCACTAATAA 
GGkTTAAATT CGTCTTAAAC GGtGCCTTCT kACTTgrTTT ATAATGATCG aATyCATATG 
kXGcACGCTC ACTTTGGAAT ACCGCATGCC ATTAATACAT CTGgATAACT GgATCcATAT 
TTTGgAnATA AATGaATCCa TAAGTAAATA CGTATCTTCa ATGTGTTCTG ACTTTATGTA 
TTGGAAAAGA TGTCCCCaTA TTTTCAACAT ATCTTGATAA tACGTGTCTT TAAGTTTCCT 
AAACCAACTG TAATTAAACG ATATGTTTQA TCTTGTACAT CAAATGCAGT TGTATAAATC 
TTCCCAACTT TACTACCAflT AATATGTTGA TGTTTTAGTC TTTCAAGTGA TTCTGTAATA 
TCGATATCAT TAAAACTAAT GCGCTCTAAC TGATTTAAAT GTTCTGGTAT ACCAATAATC 
AATGTATTTA TTTCGTTGCT TAGTGTGTTA TTTAATTTAA AATTCATAAT GTACCTCCTT 
AGATTTGATA TGTTACTCAC TTCAAATTGT ACAACAATAA AGCCCTcAGT GACACTGAAG 
GACTTTATAA ATGAATAATT TAATTTTATG TGTTTAGCTG AAACTTTATT TAAAGCCTAG 
AATTTACCTT TTTTGAATGC TAAACCGATA CCACCGATTT TGAATACCGC ACGTGTATCA 
ATCACTTTTT TCATGAATGC TGCTTTTTTA CCAGCGATAG GTTTACCAAA TACCATACCT 
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GTTGATTCAC CGTTTAAGAT GCGTTTAATG TTTTTAGCAA CACTTTCACC TTGTTGCATT 2160 

GCAATTTGTG CTGTAGTTGG TAATGGACGT TCTTCTCCAG CTGGGATAAA CGCTGAACAG 2220 

5 TCACCAATAA CAAAAATGTT GTCGTAACCA TTGATTGTTA AATCTTGCTT TGTAACGATA 2280 

CGTCCACX5TT TAACGCCTTC AAATGATTCT TCCATTAATT TACTACCACG TACACCAGCT 2340 

GCCCATACTG AAGTACCTGC ATTTAATTGT TGTTTTTCAC CATCTACTTC AACTACAAAA 2400 

10 

CCTTTTTCGT TACAAGCAAC GATTGGTGTA GCAATTTTAA ATTCAACACC GCGGTCTTCT 2460 

AAGTAGCTAA CTGCGTGGTT AACTAATTCT TCTGAGAACA TTGGTAACAT TTTAGGTGCT 2520 

GCTTCAACAC AAGTGATTTT AACTTTATTT TGATCCACAC CATATTTGCT ACATAATTCA 2580 

15 . ... 

GGAATTCTGT CTGTTAATTC ACCTAAGAAT TCAACACCAG TGAATCCAGC ACCACCAACT 2640 

AAGATAGATA AATCGTTATC ATCTTTTTCT TTTGATGCTG CATAGTTAGC AAATTTGTCT 2700 

20 TCGATATGAC GTGATAATTC ACGTGCTGTG ATAACATTTT CAATTTGGAA AGCATGATCT 2760 

TTCATACCTT CGATGCCGAA TGTTTCACTA ACGAAACCTA ATGCTACTAC TAAAATATCA 2820 

AAGTCATAAA TACCTTGATT TGTTTCTACC TTTTTAGCAT CACGGTCAAT TTTTGTTACT 2880 

25 TCTGCtTGAA CAAAGTTCAC TTTGTCTTTC TTCAAGACAC TTTCCACAGG ATATAATACA 2940 

TCTTCATAQT TTAGTGTACC TGCTGATGCT TCATGTAACC ATGTTGCTTC ATAGTGATAT 3000 

TCATTTTTAT TAATAAGCGT AATTTCTGCT TCTTCTGTTG ATATCGCTTT TTGCAATTTA 3060 

30 

GTTACAGTTT GTAAACCTGC ATAACCAGCA CCAAGTACAA GTACTTTTTT ACGATCTTGA 3120 

GCCATTTAAT TnCACCTAAG CnTTCATATT TTTTTAACCA AATGCTGATA ATTAC 3175 

(2) INFORMATION FOR SEQ ID NO: 314: 

35 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 702 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 314: 
<S CATCATTATT AAAGATTTTC AATCAATACA gAATCACAAT ACGTACGCAT TGTGCACGAT 60 

AAAAATACAG ATGTGTATAT TAACTATGAA CTACAAGAGC AACTAACGAA CAAAGCTTAC 120 
ATTGGTGATC ATATTTATGT TGAAGGGATA TGGCTCGAAG TACAAGCTGA TGGTTTAAAT 180 

SO 

GTATTGAGTC AGAATACAGT GGCATCGTCA TTAATTCGCT TAACACAAGA GATGCCACAT 240 
GCACAGGCAG ATGATTACAA TACGTACCAT CGTTCGCCAA GGATTATTCA CCGTGAACCG - 300 

55 
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TGGCGTTCCA TTATACCGCC ATTAGTAATG ATTGCTTTAA CTGTTGTCAT CTTTTTAGTG 
AGACCAATTG GTATTTATAT TTTAATGATG ATTGGTATGA GTACAGTAAC GATAGTATTT 
GGTATTACAA CGTATTTCTC TGAAAAGAAA AAGTATAACA AAGATGTTGA AAAACGAGAG 
AAAGATTACA AAGCTTATTT GGATAATAAA TCTAAAGAAA TTAATAAAGC GATTAAAGCA 
CAACGTTTTA GTTTGAATTA CCATTATCCA ACGGtTGCTG AAATTAAAGA TATCGTTGAA 
ACGAAAGCAC CAAGAATATA TGAnAAAACC ATCGGCATCA TC 
(2) INFORMATION FOR SEQ ID NO: 31S: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4X21 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEONESS: double 
<D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 3 IS: 
TATGTTCCGA CAACGAAACA AAGTGTAATT ACAAGAGCAA AGATAACTTT GAATGTTTGT 
AAAOGTCCAT CTTTACCTTC AGTTAAATGC ATGAACATTA ATAATTGArG TCCTGCTTGG 
ACGAATGCAA AGCCAAAGAT AATTGTCAAC TTCGCGTGGA ATGTTAATGA CGTGTATAGT 
GTTACGTAAA CTGCTAAAAG CGTTAATAOG ATAGATGCGA TAAATCCTAC AGTATGTTTC 
ATTATTGTAC TCATCCGCTA TACACCATCC CTATCATATA TACGGCAGTA AAGATGAAAA ' 
CCCAAACAAC ATCTAAGAAG TGCCAGTATA AACTTACTAT AAATAATTTT GGCGCAITAT 
ATTTGTCTAA TCOGCGTCGT TGGATTTGGA TTAATAAACA AATGGCCCAA ACGATACCTA 
GCGATACGTG ACAACCATGC GTTCCTAATA GGATAAAGAA ACTAGACCAG TAAGAACCAA 
TTGTTGGGTT AAOGCCTTCT GATGCATAGT GTGCGAATTC ATAAATTTCG AATCCAACAA 
AGACTAAACC TAAAAGTAAC GTAATGATCA TCCAAAACAT CATTAACTTT TGTTTTTCTT 
GGCGCATGTA GTAAATAGCA ATACCACATG TGTAAGAACT GAATAATAAT GCAAACGTCA 
TTATTAAAAC AAGAGGCAAT TCAAATAACT CAGTAGTCAT TTTACCTGCA TAATCGCCAC 
CATGTTGCAA AGTTAATAGT GTCGCAAATA GGGTACCGAA TAACGCAAAX XCGGCTGTAA 
TGAAAATCCA AAAGCCAAGC TTATTTAATT CGCCTTCATG TGTGCGTGAA TCAATAGTGT 
TTGTATCATG ACfCATGACT TACAGCCTCC CITTCTTTAA TACGCGCTTC TCTTAATCTA 
GCTTCAGTTT CTGCAACTTC AGCAGCAGGG ATATGATATC CGTGATCGAT TTGGAAACTG 
CGATAAATCA TAGTACCAAA AATACCGAAT . AAACAAATTA ATGCTGGAAT TACAGTTTCG 



1167 



TTGTTTGGCA TATGAATGTC TTTGTAATTA 
TTCATATCAA CAAATGTGTC GTAGTCATTC 
GGTGGAATTG CTGATGCAGT AGTCCACTCT 
CCAGTTGCTT CACGTGGAGA TTTGAAGTGA 
AATCCGATTG CCATTAATAA TGCACCGATA 
TCTGATGGCA TATAAGTGTA TAAACGACGT 
GGTAAGAAAC AAACGTTAAA TCCGATCATG 
TCGTTTAATT TGTAACCCAT CATCTTTGGA 
AATACAACAC CAGTAACCAA TGTATAGTGG 
TATTGATAGT CAGCTGATGC CATTGCTAAC 
TTAGGGATAA ATGCTAATGA GAATAGCATT 
AATGTTAATA ACCAGTTAAA CAATTTCACA 
ATTGAGAAGA ATGAGTTGAT TAACGCACCA 
ACTAAGAAAC TAAGGAACGC GATACCGGCA 
AAACGCTTAC GAGCGAATGT CGGGATAATT 
ACGATATAAA CTTCAGGGTG CCCCCATACC 
CCGCCATGTG CAACTGTGAA GAATGCTGTG 
AACGCTACTG TTAAAGGAGG GAAAGCAAGA 
ACTGTAAACA TTGGCATTTG CATAAACTTC 
ACAAAGAAGT TGATACCTGT AGCTAAGGTA 
TAATAGTTAA CACCCGGACC AGGACTGAAT 
CCAGCTGCTG GTGAACCACC AATAATAAAT 
AATAGCCAGA AACTTACGTT GTTTAATACT 
AATGGAACAA CGATATTCCA TAAACCAAAG 
ATTACACCAT GTGTACTAAA AATTTCGTTA 
GGTACTGTTA ATTGCGCACG AATAAGTAAC 
ACGGCACAGA TTAAATACAT AATACCGATT 
TTGTAAAGAT ATTTCCATAA TTTAAAGTAA 
. AATGGGGCAC . CAATTTGTGC CATTGTAATC 
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TGGTTGTCTA AGTAATGACG ACCATGTTCT 
CAATCTGGTG TAATGGCAAA GTTGTATTTA 
AGAGTACGAC CAAGGCCATC CCAGTTATCT 
CTGTATACGA TACTAACAAC AAGGAATAAG 
GTTGAAATTA AGTTTAATAA GAACCAACCA 
GGCATACCAT CTAATCCAAG AATGAATTGT 
AAGAACCAGA AGCACCATTT GTTTAATGTT 
TACCAGAAGA TTAAACCAGC TAAGCAGGCA 
AAGTGAGCTA CTAAGAAGTA CGTATTGTGA 
ATTACACCCG TAACACCACC TAAAAGGAAG 
GGTGACTCAA ATGTAATACG TCCTTTATAT 
CCAGTTGGAA TACCAATCAG CATTGTTGAA 
TTACCCATTG TGAAGAAATG GTGAACCCAA 
GTTGCCCATA CCATACTTTG ATGTCCGAAT 
TCTGAGTAAA TACCAAATGC TGGAAGGATA 
CAGAAGAAGT TAGCCCAAAG CATTGGCATA 
TCAAATATTC TATCAGTTGT CATTAATGCT 
ATAACAATTA ATGTAGTAAT AAATGTTGTT 
ATAGTTGGTG TTTTACATCT TAAAATTGTT 
CCAAGCCCTG AAATTTGTAT AGCTATTAAG 
TCACCTGCTA GTGGCGCATA GTTTGTCCAA 
GACAGGTTGA ATAAAATCAT ACCTGCAAAG 
GGGAATGCAA CATCACGTGC TCCAATTTGT 
ATAAATGGCA TTGCCATGAA GATAATCATG 
TAGTGGTTAG ATTCTAAAAA TTTGTTATCA 
GCATCAATAC CACCACGGAC GAACATTAAT 
TTCTTATGGT CTACAGATGT GAACCATTCT 
GTAATTACTG CGATTAAACC AATAACTAAG 
ATcCAGTTAC CTTTAACTAG TAATTGATCC 
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TTGAAATTTT CTTCATTTCT TTCGCATTTT TCGATTCATC TTTCTTGAAC TCATTGTTAT 
ATGGTTCGTC ATTTCCAAGA ATCATCAACT TCATACCATG TCGTTTATAG TTCGCATTTG 
TAATTTGAGC TTTACGAGCA GGTATTAATG GTTTGTCTGA TACATCTTTA AACATATTTT 
CTTCACTAGT GAAGTTTGGA TCTTTCAATT CGAAATTGAA ACGTTTATAT GCATAGAAGA 
TGTATTCTGG ATCGGCTGCT- GGATCAACAA ACGCCATATG TGTACCATTA AATTCTAAAG 
CTTTATTAGG TGTGCTTGGT AATAATTGTT TATCAAATGT ATCTTGATCT AACGTTTTCT 
TACCTTTAAC TTCTTTCACC CATTTGTCGT . AGTCTTTTTG ACTAACGGCA TTTACTTTAA 
ATGTTTGACG TGAGAATCCT TCACCATTGA AGTTAGAGTT ACGACCTCTG AACGTACCAG 
TTTGAGATGC TTCTAACGTC CAATTCATTG TCATGCCAGT CATGGCATAT TTTTGACCAC 
CTAATTGTGG AATCCAGAAA CTTGrCATTG TATCCATAGC TTGAAGCTTA AATACAACAG 
GACGATCTTT AGGGATTGTT AATGTATTAA CAGTCTCTAT ATGTTCATCT GGATAAGCAA 
AGAACCATTT GTATCCTGCA CTTACTGCAT ATACAACCAT TGGATCTTTC TCACTCTTCG 
GTGGTTTTTC GTAATCGTAT AAAGTTTTAA CTGTAGGAAT AGctAAAGCA GCAACGATTA 
TGATAGGTAT TACAAACCAT ATTGTTTCAA TGATGGCATT ATGG7GCATC TTACCAGATT 
CXSGCATTCTT ATTATAACTA TACTTGTAAA TAAAAATGGC GAACATGCCA AGTACAACGA 
AACAAATAAC AAGCATGAAG ACGATTGAAT AAAGAATCAA GAACTTCTGA CTACTTGCTA 
CTGGCCCTTT TGCGTTGAAA ATTTCTATAT TTGAACAACC ACTAAGTAAA ATTAGTGTGC 
CAAATAATAG AAGCAAAGAC TTAAATTTTG ACACTTTTTT GACCTCCTAA TACTACAAAT 
GTAGGGCTTA ACATTAATTT TAAGTTATTA CACAATATTT ACAAGGGCTT ATGGGAAAAA 
AATTAATAAA ATTGTATCAA AAATGTTGAT AAATCAAGGT GTGACGTGGG TTCACACATT 
TGTTAAAATT ATGTOTACAT TTTOTOACTA ATAOCGTTTT T 
(2) INFORMATION FOR SEQ ID NO: 316: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 9310 base pairs 

(B) TYPE: nucleic acid 
<C) STRANDEDNESS: double 
(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 316: 
CGAGTGAGTA CAmACATATT TTTATTTGCA AGGGGTAAAT GGCATATAAC TATCTTTTTT 
ATGTAAGCTG GTATAAAATT TATACTAATA GGAGGGATAG TATGAATATA GTAGGGGATC 
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TTGGATTACG ATTAGTTGAA AAGTCGGTTA ATCAAGACAA TCCTTCAATG TATCATTTGT 
TTTATGGGGA CGAAgTAGGT ACAGCCGGAA CAATTTTAAG CTTTTTTGAA ATTCCCAATG 
CGGGTCATAA GCAGCCAGGT ACTGAAACGA TTTATCGATT TTCATTATTA GTACCAAATC 
AAGCGGCACT TCATTATTTT GAAAAACGTC TTGAGAATAA TGGTATTAAG TCTGAACGTT 
TGTACTATCT TGGACAAGAA GGTGTTGTCT TTAAAGATGA AGACGACTTA GAAATCATAT 
TGCTTGTTAA TGATAGTTTT GAAGTACCAC ATCAATGGCA ACATAACGCT TATAGTGAAA 
TACCTCAAGC ATATCAAATT TTAGGAATAG GGCCAGTCGA ATTAAGAGTT AGAAATGCAG 
CGCGTACGGT AGAATTTTTG GAAAATGTCT TAGGTTATCG CAAAAGAGAT AATAAATCAT 
TCGATGTGCT GACATTAGCA CCACAAGGTT TATATTCGGA TTTTGTAGTT ATTGAGCAAC 
AGGGACAACXIf TGAAAGACCT GGACGAGGTT ATATCCATCA TATTGCAGTT AATACACCAC 
AAATGAGTGA CTTAGATGCA ATTTACAAGA AATTACAACA ACAACCACAA AGTAATTCAG 
GTATAATTGA TCGCTATTTC TTTAAATCAT TATACTATCG CCATAATTCA ATTATGTATG 
AATTTGCGAC TGAAGCGCCT GGATTTACTA TTGATACACC TGTTGAACAA TTAGGAAGTC 
AATTGAACTT GCCTGACTTT TTAGAAGCAG AACGTGAACA AATTGAAAGT AAGTTACACG 
AAATATAAAG GAGAATGTTT AATGGCCAAA TTAGAAATGA ATAAAAATAC GCCTCTTGAG 
TTTGGTTTGT ATTCCTTAGG TGATCATTTA TTGAATCCAT TGAAAGGTGA AAAAGTTAGT 
TATGAGCAAC GTATTAATGA AATTATTGAA GCAAGTAAAX TAGCAGATGA AGCAGGTATT 
GATGTTTTTG CAGTTGGTGA AAGTCATCAG GAGCATTTTA CAACACAGGC ACATACGGTT 
GTGTTAGGTG CAATTGCCCA AGCGACAAAG CATATTAAAG TTTCAAGTTC TTCAACGATT 
ATTAGTGCAC AGATCCTGTA AGAGTATTTG AAGACTTCGC GACATTAGAT TTGATTTCTC 
ATGGTAGAGC CGAAATTGTA GCTGGCAGAG CATCAAGAAC AGGTATTTTT GACTTGTTTG 
GCTATGATTT AAAAGACTAT GATGAATTGT TTGAAGAAAA ATTAGGTTTA CTTTTAGAGT 
TAAATAAAAC TGAGCGTATT ACTTGGTCTG GAAAATATCG TCCAGAACTT AGAAATATGA 
AAATATTCCC AAGACCAATC GATAATATAT TGCCAATATG GCGTGCTGTT GGTGGTCCAC 
CTGCAAGTGC TATTAAAGCG GGAAAACAAG GTGTGCCAAT GATGATTACA ACCCTTGGTG 
GCCCAGCAAT GAACTTTAAA GGTTCTATAG ATGCTTATCG TCAAGCGGCA ACTGAAGCAG 
GTTTCGATgc TTCGCCTAAG TCTTTACCAG TAAGTACAGC GAGTCTGTTT TATACAGCTG 
AAACAACTCA GGATGCTATG AGAGAATTTT ATCCACATTT GAATACAGGG ATGTCATTTA 
TTCGTGGTGT TGGTTATCCG AAACAGCAAT TTGCTAATTC GTCAGATTAT CGAGAAGCGC 
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GTCATCAACG TTTTATGGCA CAGCTTGATT TTGGCGGTGT GCCATTTGAA AATGTTATGA 2040 

AGAATATTGA GTTAATTGGC AACGACATTA TACCGGCGAT TAAAAAGCAT TTATCAAAAT 2100 

AGGAGGGGCG TCATCATGAA .TATTGTATTA TTGTCAGGTT CCACAGTAGG TTCTAAAACG 2160 

AGAATTGCTA TGGATGATTT AAAAAATGAA CTAGAAGTCA TCAATGAGGG ACATCAAATA 2220 

GAGTTGATGG ATTTACGAGA ACTTGAATTA GAATTTAGCG TTGGAAAGAA TTATCTAGAT 2280 

ACTACAGGAG ATGTATATAA ATTAACGACG TCGTTAATGC AGGCTGATGT GATTTTTATT 2340 

GGTTTTCCAA TTTTTCAAGC TTCCATCCCT GGTGCTTTGA ,AAAATGTGTT TGATCTACTT 2400 

CCAGTCAATG CGTTTCGTGA CAAGGTAATA GGACTTGTAG CGACAGCAGG TTCTAGTAAA 2460 

CATTATTTAA TTCCTGAAAT GCATTTAAAA CCAATATTGA GTTACATGAA AGCACATACG 2520 

ATGCAAACGT ATGTATTTAT TGAAGAGAAA GATTTTTCAA ATCAACAAAT TGTCAATGAT 2580 

GATGTTGTAT TTCX3GTTAAA AGCGTTGGCA CAATCCACAA TGCGAACTGC CAAAGTACAA 2640 

CAACAAGTGT TTGAAGAAGA AAACAACCAA TACGACTTTT AAAGTATAAA AATAAGACGC 2700 

1. • ■ . • - ■ 

TCGGCACACT AAATTTGTAA GTGTTTGAGC GTCTTTTCAT ATTAACTATA TAGCCAATGA 2760 

2s ACGACGATAA AGGCAAGTGA TGACAAGCAT ATTGAGGTAA TAATGATTGT CATAAGCGGT 2 820 

TTAAGTGCGC GATTTTTAAG ATCTTTAAAT GCAACATTTA ACCCTAAAGC AACCATGGCC 2880 

ATTAATAAGC AAATTGTTGA TACAGTATTT AAAATATTTA GCAATGCTGA CGGAATAGTT 2940 

30 ACATATGTAT TCACTAAGGC CATAATGACA AATCCAATTA AAAAGTATGG AATGCTTATT 3000 

CGACCCTTGC TAGATGATTC TGATGAACGG AAACGCATAA TTAAAATAAG TACGATGGTT 3060 

AATGGAATCA GTAAGAATAC TCTACCAAGT TTACCAAGAA GTGCAATTTT AAGTGCATCA 3120 

CTACCACCAA AGCCACCAGC TAAGACAACG TGTGCAATTT CATGAAGACT AACACCAGAC 3180 

CAAGCGCCAT AAACATTTGT CGTCATTGAA AAGATAGCGT AGATAGCTGT ATATATAAGT 3240 

GAAAATATCG TACCAATCAA TGCGATGATA CCGATACTAA TAGCTGTATC CTTTTCACGT 3300 

GATTTGAATA TTGGAGCGAC TGCGGCAATA GCAGCAGCAC CACAAACGCC TGTGCCGACA 3360 

CCTAGTAATA ATGCGATGTT TTTGTCACCA TGCAACAGTT TGTTGACAAA GAGCATCATT 3420 

ACAATACTGA AAATAACGAC ACCTACATCG ATGGCTAATA GTTTACTACC TTGACCX3ATA 3480 

ATATCGAATA TATTGAGTTT AAGTCCATAT AGGATGATTG CAAATCTTAA TAAATATTTA 3540 

GATGAAAACG TAATACCTGA GCTATATTGT TCAGGATATC CTCTAAAGTG ACGATATAGA 3600 

SO ATAGCGATTA ATATCGCGAT AGTTAATGCG CCAACCTTAT CTAGGATTGG CAATTTAGCT 3660 

GCTAAAAAGC TAAATAATGC GACTATAAAT GTTAGTGATA GCCCAATCAT AAAATGCTTA 3720 
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ATTTTTAAAT ATAAATTTGG AATGAATAAT AAAGTAGTGA TTAAATTAAG TTGTGTGATA 3840 

GGAAACTTGG ACATCAATCA AAGTAATAGG CACTACAACG CTTATTGGCG GGGCCCCAAC 3900 

AAAGAAGCTG ACGAAAAGTC agCTTGcAAT AATG7GCAAG TTGGGGATGG GCCCCAACAT 3960 

AGAGAAATTG GGTCCGTAAT TTCTACAGAC AATGCAAGTT GGCGGGGCCC CAACATAGAG 4020 

AATTTCGAAA AGAAATTCTA CAAGCAATGC AAGTTGGGGA AGGACAACAA ATTTAAGATA 4080 

CAATGCGTAA CATTAATATG TTATTATAAT GATAATTTAC AGAATTATAT GAAAAATGAA 4140 

TGAGGATGTG ATGGTATGTT TGGAATGAAA GTGAATGAAC AAATAACATT AAAAATTTTA 4200 

GAAGCTCATG ACACAGAAGC GCTTTTCAAT TTAGTCAATC GTTCAAGAAA TTCACTTAGG 4260 

GAATGGTTAC CTTGGGTAGA TGCAACTGAG CAACCATCAG ATAGGCGTGC ATTTATTAAA 4320 

AGAGGACTTT TGCAATTTGC TGATGGTAAT GGATTTCAGT GTGGCATTTG GTATGAAGGA 4380 

ACGCTAGTTG GTGTCATCGG TTTACATGAA ATTAATCACA TGCACAGAAA AACTTCATTA 4440 

GGGTACTATT TAGATAAAGA ATTTGAGGGT CATGGGATTA TGACACAAGC AGTTGAGGCA 4500 

TTGATAAAGT ATTGTTTCGA AGAGCTTGAC TTAAACCGAA TTGAGATTAG TGCCGCAGTT 4560 

2S AATAATGAAA AAAGCCGGGC TATTCCTGAA AGGCTGGGAT TTACTAGAGA AGGTATGTTA 4620 

CGTGACAATG AATTACTAAA TGGTATTTAT TCATCGAGTT ACATCTATAG TTTATTAAAA 4680 

TCAGAATACG ACCAAAAATG ACAAATTAGA CTTACAAAAG AGTGATGACA TTTAAAATGG 4740 

. CAGCGCTCTT TTATTTAATT TTTGAAAATA AAAGGTTGTT GACAGTATTA TTTTATAACA. 4 800 

ATATAATGAT TTTGATAATT ATTATCAACT AGATGATGTT TATGGGAGGA TGCTTTAAAA 4860 

CAGCCGTTTT AAGTGTAATG TATTATTTTA GCGTGTAGGG AATGCGAAAA TAATATTTAT 4920 

AAGAACACAT CTATGGGGAT AATAGAATTT CTATAATGAG GTGTCAAAAT GAAAAAGTTA 4980 

ACAACGCTAT TATTAGCATC AACGITATTA ATTGCTGCAT GTGGGAACGA CGATAGTAAG 5040 

AAGGATGATT CAAAGACATC GAAAAAAGAT GATGGTGTTA AAGCAGAATT AAAACAAGCA 5100 

ACAAAAGCAT ATGATAAATA TACTGATGAA CAGTTAAATG AATTTTTAAA AGGTACAGAA 5160 

AAATTTGTTA AAGCGATTGA AAATAATGAT ATGGCCCAAG CAAAAGCGTT ATATCCAAAA 5220 

GTTCGTATGT ATTATGAACG CTCTGAACCA GTTGCAGAAG CATTTGGAGA TTTAGATCCT 5280 

AAAATTGATG CACGTCTTGC AGATATGAAA GAAGAGAAAA AGGAAAAAGA ATGGTCAGGA 5340 

TATCATAAGA TTGAAAAAGC ATTATACGAA GATAAGAAAA TTGATGATGT GACTAAAAAA 5400 

SO GATGCACAAC AATTATTGAA AGATGCAAAA GAATTGCATG CCAAAGCTGA TACATTAGAT 5460 

ATCACACCAA AATTAATGTT ACAAGGTTCT GTTGACCTAT TAAATGAAGT TGCAACTTCT 5520 
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GTTGAAGGCG CACAAAAAAT TTATGACTTA TTTAAACCTA TTTTAGAGAA AAAAGATAAA 5S40 

AAATTAAGTG ATGATATCCA AATGAACTTC GATAAAGTGA ATCAATTATT GGATAAATAT 5700 

AAAGATAACA ACGGCGGTTA TGAGTCATTT GAAAAAGTAT CGAAGAAAGA CCGTAAAGCA 5760 
TTTGCGGATG CTGTTAATGC ATTAGGAGAG CCACTAAGTA AAATGGCTGT GATTACTGAA - 5820 

TGACAAATTA TGAACAAGTT AACGATAGTA CGCAATTTTC AAGACGTACA TTTTTGAAAA 5880 

TGTTAGGTAT- TGGCGGTGCC GGTGTTGCAA TTGGCGCAAG TGGTGTTGGT AGCATGTGGT 5940 

CTTTCAAATC AATGTTCAAT ACACCAGAAG ATCCGGAAAA AGATGCGTAT GAATTETATG 6000 

GTAAAGTGCA ACCAGGCATT ACCACACCCA CGCAAAAAAC ATGCAATTTC GTTGCGTTAG 6060 

ATTTGAAGTC AAAAGATAGA GATGCAATTA AGGCAATGTT TAAAAAGTGG ACGGTTATGG 6120 

CTGATCGTAT GATGGATGGT GATACAGTTG GCAAGCCGAG TAACAATCCT TTAATGCCAC 6180 

CAGTAGATAC CGGTGAATCG ATAGGATTAG GTGCAAGCAA GTTAACGATT ACCITTGGGA 6240 
TTAGTAAGTC TTTGATGAAG AAAATTGGGT TATCTAGTAA AATTCCCGAT GCCTTTAAAG " 6300 

ATTTACCGCA TTTTCCGAAT GATCAGTTAA TAGACGATTA CAGCGATGGT GATATTATGA 6360 

TTCAAGCATG CTCAAATGAT TCGCAAGTAT CCTTTCATGC GGTTCATAAT TTAGTTCGTC 6420 

CATTTCGAGA TATTGTTAAG GTACGTTGGG CGCAATCTGO TTTTATCTCT GCTAAAGGTA 6480 

AGGAAACACC TAGAAATTTA ATGGCATTTA AAGATGGAAC AATTAATCCT AGGAAGAATA 6540 

30 ATCAACTTAA AGATTATGTG TTTATTGATG ACGGATGGGC GAAACATGGA ACTTATTGCG 6600 

TTGTCAGACG TATTCAAATA CACATTQAAA CGTGGGATCG TACTGCGCTG GAAGAACAAG 6660 

AGGCTACATT TGGTCGGAAA CGACATAGTG GTGCACCGTT AACAGGTGGG AAAGAGTTTG 6720 

ATGAAATTGA CTTAAAAGCG AAAGATAGTC ATGGCGAGTA TATTATTGAT AAAGATGCCC 6780 

ATACGAGGCT AGCGAAAGAA GCAAATACGT CAATTTTACG TAGAGCCTTT AATTATGTGG 6340 

ATGGTACGGA TGACCGCACA GQTAACTTCG AAACAGGCTT ACTTTTTATT GCTTTTCAAA 6900 

AAGCGACAAA ACAATTTATC GATATACAAA ATAATTTAGG TAGTAATGAT AAATTAAATG 6960 

* * * 

AATATATTAC ACATAGAGGT TCTGCTTCAT TTTTAGTATT ACCAGGTGTT AGTAAGGGAG 7020 

GATACCTTGG TGAAACATTA TTTGACTAAA TTTGTAGCAA TGCTAATAAC TGCTGCTATG 7080 

GTGTGTAGCT TTGGGTTACT GAAAAGTCAG GCAGCAGAAC AACAAAGTAT TAGTGATGTA 7140 

TATAGTGTGA TAACGGATGC GAAATCTGCA CTTTCTAATA ATTCGATATC GAATGACAAT 7200 

so AAGCAGAAAG CAATTGAGCA AGTGGTAAGT GCAGTTAAGA AATTATCGCT TGAAGATAAT 7260 

AGTGAAAGTA ATGCTGTCAA ATCAGATGTG AGAAAGCTTG AAGATGCAAA AGCGAATGAT 7320 
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GCTAGTAAAG ATGCGGGTTC TAAAATTAAA CTATTGCAAC AGCAAGTCGA TGCTAAAGAT 7440 

GCTGCGATGA CAAAAGCGAT TAAAGATAAA AATAAAGCGG AATTAGAATC TTTGAACAAT 7500 

5 AGTTTGAATC AGATTTGGAC AAGTAATGAA ACAGTGATTC GCAATTATGA CGCAAATCAA 7560 

TATGGACAAA TTGAAGTCGC ATTAXTACAA CTTAGAATTG CAATTCATAA GTCACCATTA 7620 

GATACGGCAA AAGTGTCACA TGCTTGGACA ACTTTTAAAT CAAATATTGA TCATGTCGAT 7680 

AAAAAAAGTA ATACX5TCTGC AAATGATCAA TACCATGTAT CACAATTAAA TGATGCGTTA 7740 

GAGAAGGCGA TTAAAGCTAT CGACGACAAT CAATTGTCGG ATGCTGcaTg TGCGCTTACA 7800 

CATTTTATAG AAACTTGGCC GTATGTTGAA GGTCAAATTC AAACTAAAGA CGGTGCTTTG 7860 

75 

TATACGAAAA TTGAAGATAA AATACCATAT TATCAAAGTG TATTAGACX5A ACATAATAAA 7920 

GCACATGTGA AAGATGGTTT AGTAGATTTA AATAACCAAA TTAAAGAGGT TGTTGGCCAT 7980 

AGTTATAiSCT TCGTCGATGT GATGATTATC TTTTTACGTG AAGGGCTAGA AGTGTTGTTA 6040 

20 

ATTGTAATGA CATTGACTAC CATGACGCGT AATGTAAAAG ATAAGAAAGG GACTGCAAGT 8100 

GTGATTGGTO GTGCAATTGC CGGACTTGTA CTGAGTATTA TCTTAOCAAT TACX3TTTGTA 8160 

GAAACTTTAa GGAATAGTGG CATTCTTCGT GAAAGTATGG AAGCGGGATT AGGTATCGTT 8220 

GCGGTCATAT TAATGTTTAT CGTTGGTGTT TGGATGCACA AACGTTCAAA TGCAAAACGT 8280 

TGGAATGACA TGATTAAAAA TATGTATGCT AATGCGATTA GTAATGGTAA TTTGGTATTG 8340 

30 TTAGCGACGA TTGGTTTAAT ATCTGTGTTG CGTGAAGGTG TCGAGGTTAT CATTTTCTAT 8400 

ATGGGGATGA TAGGTGAGCT AGCGACCAAA GATTTTATTA TTGGTATTGC TTTAGCTATC 8460 

GTTATTTTAA TCATCTTTGC ATTATTATTT AGATTTATAG TTAAATTAAT ACCTATTTTC 8520 

^ TATATATTTA GAGTGTTGTC GATCTTTATT TTTATTATGG GATTCAAAAT GCTTGGCGTA 8S80 

AGTATTCAAA AGTTACAATT ATTAGGTGCG ATOCCAAGAC ATGTTATTGA AGGATTCCCA 8640 

ACGATTAACT GGTTGGGCTT TTATCCAAGT TATGAACCAT TGATAGCACA AGGTGCTTAT 8700 

40 

ATTATGGTAG TTGCTATCTT AATCTTTAAA TTTAAAAAAT AAAAAACAGG CCGAGTGCCT 8760 

GTTTTTTTTG TTGCTATATT GGAAATATTC GGTATTGCAG TATAACGATA ATCACAGCAT 8820 

TGATTCGTAT AAGGTTAATG TGTTGGCGGT TTGCCTCGGC ATGTGAACTT AACGATGAAC 8880 

45 

ATACTGAACT CAAAGAGCAA TATGAGTGGC AATGTGAGTA ATATATTTAA TGTTAAATCG 8940 

GGTGGTGCAA TGATACTTGC TAATACAAAG CAAGCGAAAT AAATATATTT ACGrTAATGT 9000 

so TTCAATGATG TGGTATCTAT AAGACCGAAT TTTGCAAGAC CCATAAATAA TATTGGTAAT 9060 

TGAAATAGAA GACCAAATGT GAATAACCAA CGTATGAGTT CAATCAAATA TGCTTTAAAG 9120 
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GGAAAGCCAA CATAAAATGC AAAAGCGACG CCAGCACAGA ATAATAACAC GCTGAAAAAA 
CTATATTTAT AAATAAATTG ACGTTCATTA TTATGTAATC CAGGTGCAAT GAATGCCCAC 
AATTGATAAA 

(2) INFORMATION FOR SEQ ID NO: 317: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3453 base pairs 
{B> TYPE: nucleic acid 

(C) STRANDBDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 317: 
ATTAGTATTA CACACTAATG TAAATAGATT GGTTGGAGAA GAGATATTTG CTAATAAGTG 
CCTTGCTAAT AATGATGTTC AAATTATGAA TTCAATAAAA AAATTAATTG AAGCTGAGTT 
ATTAACAACG ACTAATGATT TTGAAGTTAG TATATATAAA AAGACAAGAC CTGAATTACA 
AAGTATTTTA AAAAGTTTTG GTATAAAAAC AACAGGTAAT AAACCTGACT TAATTAAACG 
TATTGACGAC AATTTTCATA TTATTAATAA CTTAGATTTA CCATATGTAT ATATACCAAT 
TAAGAAAGGA GAAGAAATTT TAAAGAAAAC AGAGTACTTA ACCTCTTTTA TACAAAGTTA 
TGGTGAAATT TCTCTTGAGC GTGCTTATTA TTTGGTTGAA AACTATATAO ATGAAAATTG 
CGATGATAAA GTTGCAGAAA TATACAAGTT TGAATTTCAA AGAAAATATG ACAATGGCGA 
GTTTGATTTT AATCATGGAT ATAATirTCGA ATTGAATATG TTGATAGATC ACTATAAAAG 
AGATGTAAAA GACTACGATA ATGCCAGAAA GTATTCAAAT ATTTATCTTT ACTTTGGTTT 
GAGAGATTTC TTAAAAAAAT TAATGAGTAA TTATTCATAT TACGATAgTA AAGGGAATAT 
AGATTTGAAC GAAATACAAA ACGATCTGAA TAGATTTATC AACTCTAGCG CTTCTGGTAT 
GTACGAGCGA TTAATATATA ATGAAAATTT ATCCAATAAT ATTATGTTTG AATTATTTAA 
AAAGGACACA CAAGATTATA GTGATTTGGA AGAACAATTG ATTGAAAAGT TCATAAACTA 
TGTAGTGTCT AATGTAAAAA AAGAAAGTAG GAGTAATACT CTTATAGAGT TATCAAAAAT 
TTTAGAGAAC GGATATACAA TTGATAAAGA AGAATTTAAA AAAGAAGATG ATTATCTTTC 
TAAGTACATA TTTACTGACA TAGATTATTT GAAAAAGTTA GAATCAAAAA TAAACGTTGC 
TATTGATATT CGAAGTGGAG AAATTCATTT GGTATTAGAT GATGATAGCC TTGATATATT 
AATACAAAAT CAAAAATACG GCAATGAGTT TTGAGTCATA ACTAAATATA ATATGTTGAA 
GAGAGGTTTT ATTTAAATGG CTAAAATTGG TTATGATCGT GTATCAACGA AAGATTAATA 
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AACGTACAGA GCTTGTTAAG TGTTTAGATT ATTTACGAGA GAGCXSACACA TTAGTTGTCT 
ATCAACTTGA TCGGTTAGGT AGAACGACAA AACTATTaAT TGAATTaTCA CAATGATTCG 
ATGATAACGG AATTGACTTA CAAATTAGTA ACATGAACAX TTCAACGAAA GACACAATGG 
GCAAAATGTT TTTTACGATG ATGAGTGCAT TTTTCaGGAT TAGAAGTTAA TTTACTATGT 
GAGTGTATAA AATAGACTTA GCAGCAACAA GAGCGAGAGG CCGAAAAAGC GGGCGCCCCT 
CTTTACCAGA GAATAAAAAA TGAGAAATTA AATTTTTATA TGATGAACAA ACGATAACAG 
GGGAAGAAAT AGCTAGTTAG ACAAGGGTAT GTCACTCAAC TGTTTATCGA GTTGATTAAG 
AAATGAAAAA ACTTATACTA TGAATTACTG TTTAAAAGTG TGCATGTTAT AATATTTATT 
GAGCAAGTTG GATAGATGGT GGCTAATCTC TTAATAAAQG GGTGATGCCT ATGGTTATAG 
TTGTTACTCC TAGnAAAGGA CTAGCATGTC TGATTTTGAA ATGCTTATGG TTGTATTAAC 
AATCATTGGT TTAGTATTGA TTAGTACTCA AGACCATAAA AAATAaCCTT CTATTCGCTT 
TGACCGGCAT TTTTGAAGGC TATTTTTAAA TAAAATATAA GGTCACCGTC TTTTTAACGG 
GCTCATTAGG GTAACATGTT TCCGAGTGTT GCCCTTTTTG TGTTTCAAGA GTTAATQATT 
TTCATCTTTT GCTTCTACTT GCTACAAATA TATTTTAACA CATTTTTCTT ATGAATTGTA 
GTTCTGAACA TAATCAGAAT TAATAAAACC AACTTTCCAT ACAGCAGAAA ATACAATTAA 
AAGTATAGAA TGTAATCACG AATTATATAA AAAGTATTGG AGACCTCTTC ATATATAGAT 
AATTGACTTA GTTATT7TAG AAAGAAGCCC CTAaCAACTA AAGTTGAAAA ATAGAGGAAC 
ACAGTTgGAT TACGCATCAA CTGCATaAGg CCCCTAAmAA CTAAAGTTGT AAGGGGCyCT 
AAAATTTATT TTGGTTGATT GTCTTCTGGT TTATCTGAAG TCATTGTTTT TGTTGTATTA 
TCATTTAATG AATCTTGTGC TTTTTCTGTT .TTTGTTTCAA CAGATGTTGT CACTTTATCA 
TTTTCTACTT TTGTATTTTT TGGTTCAGTG ACAACTTTTT TATTCTTGTC AGCTGTTTTT 
ACTTTATCTT TAGTAATTTT TTGACCACGT TTTAAGTAAT ATTGAACGAT ACCCATTAAA 
ATGATTGCAT GAATAACAAC GAATAAAATA ATTGTCATTA CTGTATAAAC TCTTATGAXA 
TTTTCTGCAA CACTTTGAGA GAGTGATTGC GTATTAAATG AAATCAAGTA ACCAACAGGT 
GTTTTAAATA AAATAATAAT TAAGTTTAAT AATAGTATTC CAATGAAAAA TTTGAAAAAT 
GTTTTTTGAC CATTTTTCAT TGCTTTAAAT CCATTAGCTA AGTGTGTTTT TACTTTATCX5 
TTAGTTGATT CaACGAAACT AGTCaTAAAG TTGAAAATAG GTATTAACAA TAACCAAGTA 
ATAATTGCTT TAATCAATAA AACAACAATG ATTATGATGC TTTGAGTTGT AATAGCAATA 
CCAATCAGGT GTGTACTATC TGCATATGAT GATTGTACTG AATTCATAAT CATTTCTGAT 
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ATAGATACAA GACCGATCAG AACGCTCTTT AAATAATTAC CTTTTTTAAA TGCAATAAAT 
AAATCGGTAA ATTTTACTTT TTCATGACTC ATTGCTCGTT TCATAACATT TGTAATTCCG 
ATAAAAATTT GAACTAAAAC AAACAGTGAA ACTACAGCTG CTATAAGTAA TACAGCGATA 
ACTTTTAAAT ATGCATCTAC TGGTGGTTTT TGCCCAAATT GTGAATAAAT TGCAATAGTT 
TGTGCATACT TAGCAAGCTG GAAATTAGCA AGTAAATATA CAACTGCAAT TACAGCAAAT 
GCTATAAGTG CATATATCAA TGTTATTAAT AATTGTGGTT TAGCATTTTT AAATGCTGAT 
TTAAAGTAAG TAAACAAAGT GGTGCCTCCT TTTCTTCA 
(2) INFORMATION FOR SEQ ID NO: 318: 

(i> SEQUENCE CHARACTERISTICS: . 

(A) LENGTH: 695 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNBSS: double 

(D) TOPOLOGY: linear 
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(Xi) SEQUENCE DESCRIPTION; SEQ ID NO: 318: 
GCTTGCAAGA TGCTTTCATT AAAGACAAAG TCATCGATAT TATGAATATG TTCCAAAATC 
ACACTGATAT CACTTATACG TTGAATAAGT CTCATGCACA TATTATATGT ACGCCAGAaA 
TATTTGCTAA ATTQTTACAT ACOATTGCAA CTAGAAATAT CGACATTCTA . TCTGCCAATT 
ATAGATCGTC ATCTATGAGC AAAGCTCGTA TATCATAATA AAAGACACAT CTATACGATG 



ATCATTTACA ATGATTGCGT ATAGTGATGT GT( 



GTATTATTTA TCTTCGGAcG 



ATTGATCCTC AACCATTTGT TCAAATGCTT CACGAACTTG TGGTACTGTC ATACCTACTA 
CAACTTGGAT ACTCTTACCA CTCTTTACTA ATCCGTGTGC CATTTGTTGA TGCGTGAAAT 
ATTCCGTATC TGCAACTTTA CTTTCATCAT AAACAGTTAA GCGTAATCTT GTTGTACAGT 
TAGTAACATC TTTGATATTT TCTTTGCCGC CTAAACCGTC GAGGTAATAT GCAGCTTTGT 
CTTCGTATTC ATTACCAGAT GAAGCACGTT TAGAATCTAC GCTATCACCT TTTTTATTTT 
TGTAATCTTG CTTAGAAAAT AATTTAACTT CCTCTTCTGT TTyCTTACGT CCAGGTAATG 
GAATATCAAA TTyCAAAATT AAGAATCTGA ATAAG 
(2) INFORMATION FOR SEQ ID NO: 319: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 875 base pairs 

(B) TYPE: nucleic acid 
(O- STRANDEDNESS : double 
(D) TOPOLOGY: linear 
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{xi) SEQUENCE DESCRIPTION: SEQ ID NO: 319: 
AATATTGaTa TTATATATAG TCGAATCaAT GATGACCCaC ATCGACCtAA TGCAAATAAT 
AAGACAATCA AGCAGTTAAA TGACTTGTAT TGCTCGCGGA ATTTAAGATA TAATGAAATC 
GCATTCAAGA AATTTGATAG TCATTTGCTA TCAATTTCAG AAATATATTA TGAATTGCTA 
AATTTAATAA AAGCGAGTGA TCAGTATTAG AGAGAATAGA GCGTTAAGAC TCTATCGCCG 
AAGtGCAAGT AATTTATTAC GAAACTCTCA GGcAAAAGGr TAATACTGTA ACGCGTTCCT 
6AATTGGTGA TTTATAAACA GGGTAGCGAT TGCTATCCTG TTTTTATAAT TTTAAGGGGG 
TATTTCAATG TCAAGTGATT TAAAACAAAC ACCTTTATAT CAAAATTATG TTGATAGAGG 
TGCAAAAATT GTGGAATTCG GAGGATGGGC GATGCCTGTT CAATTTTCAA GTATTAAAGA 
GGAGCATAAT GCTGTTCGAT ACGAAATTGG CCTGTTTGAT GTTAGTCATA TGGGTGAAAT 
TGAAGTAACA GGTAAAGATG CTAGTCAGTT TGTGCAATAT TTATTATCAA ATGATACTGA 
TAATTTAACT ACTTCAAAAG CATTATATAC TGCTTTATGT AATGAAGAAG GCGGTATTAT 
TGATGATTTA GTAATATATA AATTAGCTGA CGACAATTAT TTATTAGTTG TTAATGCTGC 
TAATACTQAA AAAGATTTTA ATTGGATTTT AAAACACAAA GAGAAATTTG ATGTTGAAGT 
ACAAAATGTA TCAAACCAAT ATGGTCAATT AGCAATACAA GGACCAAAAG CtAGAGATTT 
AATTAATCAA TTAGTTGATG AAGAkGTAAC TGAAA 
(2) INFORMATION FOR SEQ ID NO: 32Q : 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 5897 base pairs • ■ 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 320: 
TCTTTTTACG AAGGCTACCG TTTAGGATCT GATAACTTAA CTGTAGGAGA AATTGTATTT 
AATACAGCGA TGACAGGTTA TCAAGAAACT ATTTCAGATC CATCATATAC AGGTCAGATC 
ATTACTTTTA CGTATCCATT AATCGGTAAT TATGGTATCA ATAGAGACGA TTTTGAATCA 
TTAGTACCTA CATTAAACGG TATTGTAGTG AAAGAAGCGA GTGCGCATCC AAGTAATTTT 
AGACAGCAAA AGACACTTCA TGACGTTTTA GAATTGCATC AAATTCCAGG GATTGCAGGT 
GTTGATACAA GAAGTATTAC GCGTAAAATT CGACAACACG GTGTGTTAAA AGCTGGTTTT 
ACTGATCGAA AAGAAGATAT TGATCAACTT GTCAAACATT TACAACAAGT AGAATTACCT 
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AGTGTCGTAC TTGTAGACTT TGGTAAGAAG CAAAATATTG TTCGAGAATT AAACGTCAGA 
GGTTGTAACa TCACAGTTGT ACCATATACA ACTACTGCCX3 AAGAAATTTT AGCAATGGCT 

« 

CCAGATGGCG TTATGCTATC AAACGGACCA GGTAATCCTG AAGTTGTAGA ATGTGCGATT 
CCAATGATTC AAGGAATTTT AGGGAAAATT CCGTTCTTTG GTATCTGTCT AGGACATCAA 
CTTTTTGCAT TATCTCAAGG AGCAAGCTCA TTTAAAATGA AGTTTGGTCA TCGTGGTGCG 
AACCATCCAG TTAAAAATTT AGAGACTGGA AAAGTTGATA TTACGAGTCA AAACCATGGA 
TATGCAATAG ATATAGATTC GTTAAAAAGT ACTGATTTAG AAGTTACTCA TCTTGCATTA 
AATGATGGTA CTGTAGAAGG TTTAAAACAT AAAACATTAC CAGCATTTTC TGTTCAATAC 
CATCCTGAAG CAAATCCAGG ACCGTC7VGAT TCAAACTATC TATTTGATGA TTTTGTAGCA 
ATGATGACTA ATTTTAAGGA AAAGGAGCGT CATATCAATG CCTAAACGTA ATGATATCAA 
AACAATTTTA GTAATAGGGT CTGGGCCAAT TATCATAGGT CAAGCAGCTG AATTTGATTA 
TGCTGGAACA CAAGCATGTC TAGCTTTAAA AGAifWlAGGGA TATCQAGTTA TTCTTGTAAA 
TTCAAATCCA GCGACAATCA TGACTGATAA GGAAATTGCG GATAAAGTAT ATATCGAACC 
GTTAACTCAT GATTTTATAG CGCX5AATTAT ACGTAAAGAG CAACCTGACG CTTTACTTCC 
AACTTTAGGT GGTCAAACAG GTTTAAACAT GGCGATTCAA CTACACGAAA GTGGTGTGCT 
TCAAGATAAT AACGTCCAAT TATTAGGAAC TGAGCTAACA TCAATTCAAC AAGCAGAAGA 
CCGTGAAATG TTTAGAACAT TAATGAATGA TTTAAAOGTT CCTGTACCAG AGAGTGACAT 
TGTAAATACA GTAGAGCAAG CCTTTAAATT CAAAGAGCAA GTGGGATACC CGCTAATTGT 
TAGACCGGCA TTTACGATGG GTGGTACCGG AGgCGGTATT TGTCATAATG ATGAAGAATT 
ACATGAAATC GTCTCAAATG GTCTTCATTA TAGTCCAGCA ACXJCAATGTT TATTAGAAAA 
ATCTATCGCA GGTTTTAAAG AAATCGAATA CGAgTAATgC GTOaTAAAAA CGATAATGCC 
ATCGTTGTAT GTAACATGGA AAATATTGAT CCAGTTGGTA TTCATACAGG CGATTCAATT 
GTTGTGGCTC CTAGTCAAAC ATTATCAGAT GTTGAGTATC AAATGTTACG TGATGTTTCA 
TTAAAAGTTA TTCGAGCTTT AGGTATCGAA GGTGGTTGTA ATGTTCAATT AGCATTAGAT 
CCCCATTCAT TCGATTATTA TATTATAGAA GTAAATCCGC GTGTATCACG TTCATCAGCG 
TTAgCTTCAA AAGCAACAGG ATATCCTATT GCAAAATTAG CTGCTAAAAT CGCGGTTGGT 
CTAACATTAG ATGAAATGTT AAATCCAATT ACAGGAACAT CTTATGCAGC GTTTGAACCA 
ACTTTAGACT ATGTGATTTC AAAAATACCA AGATTTCCTT TTGATAAATT TGAAAAAGGA 
GAACGAGAGC TTGGCACACA AATGAAAGCA ACAGGTGAAG TTATGGCCAT TGGTCGAACT 
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TTACCAAATG 


GTGAAAGCTT 


CGATCTTGAT 


TATATTAAAG 


AACGTATTTC 


ACACCAAGAT 


2340 




GATGAACGAT 


TATTTTTCAT 


CGGCGAACAA 


TTAGAAGAGG 


CACAACATTA 


GAAGAAATTC 


2400 


5 


ATAATATGAC 


TCAQATTGAT 


TACTTCTTCT 


TACACAAGTT 


CCAAAACATT 


ATTGATATTG 


2460 




AGCATCAATT 


AAAAGAGCAT 


CAAGGTGATT 


TAGAATATCT 


TAAATATGCA 


AAAGATTATG " 


2S20 


10 


GATTTAGTGA 


TAAAACAATA 


GCGCATCGCT 


TTAATATGAC 


GGAAGAAGAA 


GTATATCAAT 


2580 


TGCGTATGGA 


AAATGATATT AAACCTGTTT ACAAGATGGT TOATACTTGC GCAgCTGAAT 


2640 




TTGAATCTTC 


AACACCATAT 


TATTATGGTA 


CATACGAAAC 


TGAAAATGAA 


TCCATAGTTA 


2700 


19 


CTGACAAAGA 


AAAAATCTTA 


GTATTAGGCT 


CTGGACCAAT 


TCGAATCGGC 


CAAGGTGTAG 


2760 




AATTTGACTA 


TGCGACAGTT 


CACGCCGTTT 


GGGCAATTCA AAAAGCAGGG 


TACGAAGCGA 


2820 




TAATTGTGAA 


TAACAATCCA 


GAAACAGTTT 


CAACAGACTT 


CTCAATTTCT 


GACAAATTAT 


2880 


20 


ACTTTGAACC 


TTTAACTGAA 


GAAGATGTGA 


TGAATATCAT 


TAATTTAGAA 


AAACCTAAAG 


2940 




GTGTCGTTGT 


ACAATTTGGA 


GGACAAACAG 


CGATTAATTT 


AGCAGACAAA 


TTGGCTAAAC 


3000 




ATGGTGTTAA 


AATACTTGGT 


ACrrCACTAG 


AAAATCTAAA 


TCGTGCTGAA 


GATAGAAAAG 


3060 


25 


. AATTTGAAGC 


ACTATTAAGA 


AAAATTAACG 


TGCCACAGCC 


ACAAGGGAAA 


ACAGCTACAT 


3120 




CACCTGAGGA 


AGCATTAGCG 


AATGCTGCAG AAATCGGATA TCCGGTTGTA 


GTAAGACCTT 


3X80 




CTTATGTATT 


AGGTGGTCGC 


GCAATGGAAA 


TTGTAGACAA 


TGACAAAGAG 


TTAGAAAACT 


3240 


30 


ATATGACCCA 


GGCTGTAAAA 


GCGAGTCCGG 


AACATCCGGT 


ACTAGTCGAT 


AGATATTTAA 


3300 




CTGGTAAAGA 


AATTGAAGTT 


GATGCGATTT 


GTGATGGAGA 


AACGGTCATT 


ATTCCAGGAA 


3360 


35 


TCATGGAACA 


TATTGAACGT 


GCTGGTGTGC 


ATAGTGGTGA 


CTCAATCGCT 


GTATATCCAC 


3420 


CACAAACTTT 


GACAGAAGAC 


GAGTTAGCAA 


CACTTGAGGA 


CTATACTATA 


AAATTAGCTA 


3480 




AAGGTTTAAA 


CATCATTGGC 


TTAATCAACA 


TTCAATTCGT 


TATAGCTCAC 


GATGGTGTGT 


3540 


40 


ATGTTTTAGA 


AGTAAATCCA 


CGTTCTAGTA 


GAACGGTACC 


ATTCTTAAGT 


AAAATTACTG 


3600 




ATATTCCAAT 


GGCACAATTA 


GCTATGCGAG 


CAATCATTGG 


GGAAAAACTA 


ACAGATATGG 


3660 




GTTATCAAGA 


AGGGGTTCAA 


CCATATGCTG 


AGGGTGTCTT TGTGAAAGCA 


CCAGTATTTA 


3720 




GTTTTAATAA 


ATTGAAAAAT 


GTTGATATTA 


CTTTAGGACC 


TGAAATGAAG 


TCAAPWSGTG 


3780 




AAGTGATGGG 


GAAAGATACT 


• • 

ACATTAGAAA 


AGGCGTTATT 


CAAAGGGTTA 


ACAGGTAGTG 


3840 




GCGTTGAAGT 


TAAAGATCAC 


GGTACAGTAT 


TAATGACCGT 


CAGTGACAAA 


GATAAAGAGG 


3900 


SO 


AAGTTGTTAA 


ATTGGCACAA 


CGCTTAAATG 


AAGTTGGCTA 


TAAAATTTTA 


GCAACGTCTG 


3960 




GAAcAGCTAA 


TAAATTAGCT 


GAGTATGACA TACCTGCAGA AGTAGTAGGC 


AAAATTGGTG 


4020 
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TGACTAAAGG TAAAGAAGTA GAAAGGGATG GCTTCCAAAT TAGACGTACT ACAGTTGAAA 
ATGGTATTCC ATGTTTGACA TCTTTAGATA CAGCTAATGC CTTAACGAAT GTAATTGAAA 
GTATGACATT TACAATGCGT CAAATQTAAA TCAATCAAAC TGTATCGGTG GGGCTGTAAT 
TAACCATTTA CTTAAAGAAG TTTATATTAC AGCCTCATTA TTTTAATGAA TTTCTTAATA 
TAAAGGGAGA CaTATATGAT GAAAGATTTA CCAATTATTG CATTAGATTT TGAATCAAAA 
GAAAAAGTAA ATCAATTTTT AGATTTATTT GATGAATCAT TATTCGTAAA AGTAGGTATG 
GAACTTTTTT ATCAAGAAGG TCCTCAATTA ATTAAXGAGA TAAAAGAAAG AGGCCATGAT 
GTATTTrTAG ATTTAAAACT GCATGATATT CCTAATACAG TTGGTAAGGC GATGGAAGGA 
CTAGCTAAAT TGAATGTTGA TCTGGTAAAT GTTCATGCTG CTGGTGGCGT AAAAATGATG 
TCTGAGGCCA TTAAAGGATT AAGAAAACAT AATCAAGATA CAAAAATTAT TGCAGTAACA 
CAGCTTACGT CAACAACAGA AGACATGTTA CGACACGAAC AAAATATACA AACATCGATT 
GAAGAGGCCG TTTTAAATTA TGCCAAGTTA GCAAATGCAG CTGGTTTAGA TGGCX5TTGTT 
TGTTCACCTC TTGAAAGTCG TATGTTGACT GAAAAGTTAG GTACATCATT TTTAAAAGTA 
ACACCAGGTA TTAGACCTAA AGGTGCATCT CAAAATGACC AACACCGTAT TAGGACACCG 
GAAGAAGCAA GACAGCTTGG TTCGACGCAT ATTGTAGTCG GTAGACOGAT TACACAAAGT 
GACAATCCAG TCGAAAGTTA TCATAAAATT AAAGAAAGTT GGTTAGTATA ATGGCTAAAG 
AAATTGCAAA ATCATTATTA GATATTGAAG CTGTAACATT ATCACCAAAT GATTTATATA 
CATGGAGTTC AGGTATTAAA TCACCGATTT ACTGTGATAA CCGTGTTACG TTAGGTTATC 
CTTTAGTTCG AGGCGCAATC CGCGATGGTT TAATTAACTT AATTAAAGAA CACTTTCCTG 
AAGTAGAAGT TATTTCTGGT ACTGCAACAG CTGnTATTCC ACATGCAGCT TTTATTGCTG 
AAAAATTAAA ATTACCAATG AATTATGTTC GTTCATCAAA TAAGAGTCAT GGTAAGCAAA 
ATCAAATCGA AGGTGCTAAA AGTGAAGGTA AAAAAGTAGT TGTGATAGAA GATTTAATTT 
CGACAGGGGG ATCTTCAGTC ACAGCAGTTG AAGCCTTAAA ACTAGCAGGT, GCAGAAaTAT. 
TAGGTGTTGT AGCTATCTTT ACTTACGGTT TGAAAAAAGC AGATGATACA TTTAGCAATA 
TTCAACTACC TTTTTACACT TTAAGTGATT ACAATGAATT AATTGAAGTA GCTGAmAmTG 
AAGGTAAAAT TTCTAGTGAA GATATCCAAA CATTAGTTGA ATGGAGAGAC AACTTAGCAT 
AATATAGACA CTAGAAGGAG GAATTCAACA AATGAATGAC AAAACATCTA ATGATTTATA 
TGGGAAGATA AAACATTGTA ACGAATTTAT CAATCATTCA AATGATTCCA ATCTATCTAG 
TAGTCACGAT GTCGACGAAA 6TTCAACGAA GCAAAAACAT ATAAAAAATA AAACAACTAT 
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TTAAAAACAA AAAAGCT 

(2) INFORMATION FOR SBQ ID NO: 321: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 7965 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 321: 
TCATTCTAAA TCAACTTATT TTCCATTGCA TAAATTGCTG CTTGTGTACG ATCGCTAACT 
TGTAATTTAC TAAATATATG ACTGACATGT GTTTTAATTG TTTTTTCAGA TACAAATAAA 
GTTTCTGCAA TCTCTTTATT TGTTTTACCT TTAACCATTT CACGTAACAC TTCAATTTCT 
CTCTTTGACA ACTTATTCGT GTAGTGTGGT TTTTGGCTAA CTGTTTCGAA TACATCTTGT 
GCCTTAGGAT GTATCATTTT TTCACCGTTC ATAACTCGTC TAATAGTTTC AATTAATTGC 
TGAGGCTCAA CGTCTTTCAT TTCATAACCA TCAGCACCTT TATTGATTGC TGAAATTACA^ 
TGTTCATCAT CAACATAACT TGTTAATACC AAAACTTTAA TATCCGGATA ATGTGCCTTA 
ATATATTCCG TAATTTCAAT ACCATTCATG CCAGGCATCA CTAAATCTAA TAGCACAATA 
TCAGGGTCCT CATGCTCTTT TAAATATTCT AAAAATGTTT CTCCATCTGC AAAGTCTTGT 
AAAACTTCTA TGTTTTCAaT CGTGGaTAAT AAAAATCGCA ATCCTTGtCG CACAATATAA 
kGGwCATCTA CTAATATnAC TTTGTTCATG GGTTATCTCC TTAAAtCAAG CTATTTTATA 
GGAATTGTGA ATTGTATTTG TGTACCCTTT GTTGGCTGAG AATGAAAGGT CACTTTACCT 
CTTAATAATT TAACTCTTTG TTTTATGTTA TTAATACCGT GTGATGAAGC TATCTGAACA 
TTATCGATCr CAAATCCTTG ACCATAATCA ATCACGTCAA TATATAGTAT ATCGTTCATT 
TGTTTTAATG TAAGATCCAT TTTATTCGTA TCAGCATGTT TCTTAACATT ATTAATACAC 
TCTTGTAATG CTCTGTATAT GTTTTCTTCG ATTTCATTAG ATAAATCGAT TAAACCTTCT 
ACATTTACAT TTAATTGTAT ATGCATTAAT TTACTATATG CTGTCAAAGC ATGAATTAAA 
CCTTGCTCAA GTCCAACTGG CTTAAGTnGC CAAATCAATG CACGCATTTC ATTAACGGCA 
TTTTGACTCG TTtCCTCAAT CGTCTTGAAT GCTTGTTTAG CGATGGATTC GTTTGACATG 
CCATACGCAG CATGTCCtGT TAGTTTTACA GAAAATAACA TTTGATTTAC TGAATCATGT 
AAATCTCTAG CTAAACGATT ACGTTCATTA ATTTTTGCCG CTTCTTTTTC ACGGTCTGTT 
AAATAAATAC GTTTGATGGC TGACCCTAAT TGAAATGCGA CAGACTCTAG CAACTCTAAA 
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TGACCCGATT TAAGTGGTAC CGTTGCATGA TGTGTAATAT TGTCATTTTO GCTAGGAAAT 
GCTTTAGAGG CTAAGTTAAT ACX3AGAACAA TTGACGATAT TCGACGCTTT CATTAGCCTA 
CGTTGATTAA ATGCTTTCAC ACACCAACAA GACCCATCTT TAATATAGTG ACAGTGGTCT 
GCTGTCAAAG ATTGTGGTAG AGCCACATGT GATACAAGTT CATGTTCACC TACGCTATTG 
ATGAAAAATA TCCAGCCTGT CGTGAAATTA CTGCCCTCAA TTAAATATTT TAACGCACCT 
TGGGTCATGC TATACATTTC rGTTTCTTCG TTTAAAAATT CGGCAATCTC TTTTAATAAA 
GCTAGTCGCG TCCTTTGTTC CATCAAATCG CTCCAATTCA TTTTTACGTG TATTAACTAT 
TATACATTGA GTTATTATAT TTTTAAATCT TAGACGTAAA CATGATAAAA TGGCCTTGAT 
TACTCAATAG TTATATTTCG GAGAACTGAT TTGTGATATG ATATTAAAGA CTATAGGAGG 
ATTTTATGAA ATTTAAAATA CCAGAAAACT TTAATGACTT AAGTTTACGA GATATTTTCC 
AACAACTTAA GGTACCTAAA AAAGATTTAC ATCATTTAAA TATGTCTAAA GATATTACTA 
TTAATGATAA ACCTGCGCGA TTAATGGATA AAGTGCATAC TGGCGACGAT GTATTTGTTC 
CAACCATCGA TGAAAAAAGT AATTATGTTC CAAGTTATCG TTATGCACAA ATTAAATACG 
AAGACX3ATGA TATGGCAATC GTAATGAAAC CTAAAGGTGT TAAGACTCAC CCTAATGATT 
TAAAAGAAAG CAATACTTTA ATGAATCATG TGATTTACAC TATTGATAGT GACTATGTCG 
AACCAATTCA TCGACTGGAC CAGGAAACAG TAGGATTATT AATTGTTGCT AAAAATCCTT 
TAATGAAAAA AATTCTTGAX CGCATGTTAG AAGACAATGA TATTACGCGG ATATACAAAG 
CAAATGTTAA GGCACTTTTA CCTTTAAAAC CACAAACGAT TGATATGCCA ATTGGTAAAG 
ATAAATICCA TTCGAATAAA CGACGTGTGT CTCCTACTGG ACAGCGTGCA ATTACACACA 
TTTTAACTTC AAAAATGATA AAAGAAGCTG TGTGCCmACT TGAAATCAAG TTGGATACTG 
GACGTACTCA TCAAATwCGT GTGCATTTAG CTGAAATTGG TCACCCTGTT ATTGGTGATC 
CTTTATATGG TGATTCAACG TTAAGACAAT TAGAACTTGA AAGTTACAAA ATAGAGTTTG 
TGcATCCCTT GACTAAGGAA GTCATTTCCG TTTCTTTGGA . TGACTAATTT GATTAGTTTT 
GCATGATATT tAAACATGCA ATACCGCATT GTAACTAAAT CAAGTATCAA CtTAAAcGGA 
TAGATGGAAA ATTATTAATT TTTTCAGATG TTCGGTTTTT TTGTrTTTTA CGATGCTTAG 
GATTTTATAT TTTGATATTT TAGTAATTAT TCATTTTATA ACATCCTTGG ATAATGACTT 
GTAGTCTTTT TCAACTGCGT TACGTGTATC TATGGACAAT ACATGACATC ATAAGAXTTT 
TATCACAGGT TGTTTGGCCA ATACATGTAC AACAATTCAT CATATAAAAA ATAGGTTCTA 
TAATAAAACG GACTCCATGA AAAGTTTTTC CTTTTCATGG CTCTATATCA AATCAGACTT 
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CCAAACTTTA TTTTATATTA ATATTTAATT AATGAGGATC TACCATATCT TCTGGTTTAA 3240 

TCCATGCTTC AAATTGTTCT TCTGTAACAT ATCCAGTTTG AATTGCAGAT TCTTTTAAAG 3300 

TTAAACCTTC TTTATGGGCT TTCTTAGCAA TTTGAGCTGC TTTTTCATAA CCAATATGTG 3360 

GATTTAATGC AGTAACTAAC ATTAATGATT GATTTAAATA ATTATCAATA TTCTCTTCGA 3420 

TTGGTTCAAT GCCCACTGCA CAATTGTTAT TAAATGTTTC CATACCATCA GCTAAAAGAT 3480 

AAATTGATTG TAGTGTATTA TGCATAATAA CTGGTTTATA AACATTCAAT TCAAAGTTAC 3540 

CTTGTGAACT TGCGAACCAA CAACTGTATC ATTACCCATT ACTTGGACTG CnACCATTGT 3600 

TAACATTTCA CATTGTGTAG GATTAACTTT ACCAGGCATA ATTGATGAAC CTGGTTCATT 3660 

TTCAGGGATA GAAATTTCTG CCAAACCAGC TCGTGGCCCT GAAGCCAACC ATCTCACATC 3720 

ATTAGCAATT TTCATTAAGT CTCCTGCTAA TGCCTTCAAT GTTCCATGCA ATTGAACAAC 3780 

20 TTCATCATGC GCTGTAAGTG CGTGGAATTT ATTTTCAGAA GATACAAATG GATAACCCGT 3840 

ATTTTCTGAA ATATAATGTG CCACTTTATC ACCAAATTCA GGATGCGCAT TAATACCAGT 3900 

ACCAACAGCC GTACCACCGA TGGCAAGATT TAAAATGTGC TTCTTAGATT CAGATAACAT 3960 

2S TGTTTCACAA CGGTCAAGCA TATAACGCCA GCCACTAATC TCTTGTCCTA GTTTGATCGG 4020 

CGTTGCATCT TGTAAATGTG TACGACCAAT TTTAATAATT GAATCAAATT TATCTTCTlcT 4080 

TTCTTTCAAA GTATTTCTTA AAAGTTTTAA TGCAGGTTCT AATTTTGTTT CAACCTCTTG 4140 

ATATAATGCA ACGTGCATAG CAGTTGGGaA TGTATCaTTC GaACTTTGAG ATTyATTTAC 4200 

ATCATCATTk GGGTGGATAC TTTCATCACT TTGATGATCT TTTAAATACA TATTAGCAAC 4260 

ATAACTTACT ACTTCGTTCA CATTCATATT ACTTTGTGTA CCGCTTCCTG TTTGCCATAC 4320 

AACTAGTGGG AAGTGTTCAT CTAATTCACC TGATAAAATT TGATCACATG CGTATACAAT 4380 

GGCATCTTTC TTTGCCTCGC TTAATTTTCC TAAATCAAAA TTAGCTATTG CTGCTGCACG 4440 

CTTTAGTP6T GCAAAACCAT AAACTACTTC GATTGGCATA CGCTCTTTAC CAACTGGGAA 4500 

ATTACGTTTA CTTCTTTCTG TTTGAGCACC CCAATATTTA TCTGCAGGTA CTTCTATTTC 4560 

TCCAAAAGTA TCATGTTCAA TTCTTACTGA CATTCAATTT CTCCCCTTAT CACTGTTTAT 4620 

4S TTAACTGTAG TATATCATTA AATAATTTAA TTGAGCAATT TATGATTAAA ACGTTTTCAT 4680 

AATTTGAAAT AAAAATACAC TAATCGCACG TGTTCACCCT TTATTACAGT GATACGGTCA 4740 

TACGATTAGT GTGTTATCTA TCATTATTTA GTTATTATTG AACTAAGTTT AATTACGATA 4900 

CTTTGTTTTA GTAGCTTCAA CCGtAGCAAT AGCTGTAAGT ATATATAATA CAGCACTAAC 4860 

AATTGTCGTA TATGGATTTA GAGCAACAAG CGTaCCTAAA ACTCCTGTTA AACTCGCATA 4920 
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TACAATACCT GATTGATTAC TTTTAATGAA TGTTTGCGCA TTAACATCAT CAATTAATCC 5040 

TTTTGATAAA TTGAGTTGTA ATTTTATTAC TTTGAAAATA ACAGGTAAAT ATAATGCCCC 5100 

AATTGCCAAT GGAAAAGCTT TAATTGATAT TAAACTTATA ATAACTGTTG CTATCAATAA 5160 

TTGAATCCAG TATTTTCCTA ACATAAATAT ATAAATCTCC TCTAATTTCA TTCTTCAATA 5220 

GCATATCATA ATCTTGGCAT ATTAAGAAAC GCGGTTTAAT GATTTCATTA AAAATATTAC 5280 

TGATAGATGA CTTCTTTCAA TTATGTCTGG AGrTAATTAAT TATCAATTCC GTTTAAATGG 5340 

TGTTTTAATA TTTAAAATTG AACTTTTGAT ATATTACTAT GTCTGGTACA CAAATCAATG 5400 

TTTTATGCTT TACAAAGTTA TATTGGCAGT AGTTGACTGC AGTCCACAAC ATAGAGGCTT 5460 

CGGAATGTCA GCTTCTATTT CATGCAAGTT GGTGGAGCTC CAACATAGTG GAATTGGATT 5520 

CCCAATTTCT ACAGACATTG CAAATTGGGG AAACGGGCCA CAAACTCAGA AACTGGTGGA 5580 

20 AAGTCAGCTT AAAATAACAT GCAAGTTGGC GAGGCCCCAA AATAGTGAGA TCGGATTTCT 5S40 

AATTTCTACA GACATTGCAA ATTAGGGAAA CGGGCCACAA ACTCAGAAGT TGGTGGAAAG 5700 

TCAGCTTAAA ATAACATCCA AGTTGGCGGG GCCACAACAT AGAAAAATTG GATCCTCAAT 5760 

25 TTCTACAAAC AATGTAAGTT GGGGAAACAG CCCCAACACT GAAACTAGCA GAAAG7CAGC 5820 

* * ~ * 

TTCTATGAAT ATAATAAAAA AGCTAGGTAA CAAAATGCTA CCTAACTTCA TATTCAAGAT 5880 

AATCAATCCT ATTTGATATA TGTTCTATAC TATACATTAT TTACATGATA AATAACTGAA 5940 

TATTACACAA TTATAATACT TTACTGACTG TCTTCTTCAG AATTCTTTTC TTGATCATTT 6000 

TGATCAGAGA TTTGTTCCaT TTCTTTACCT AATTCTTTTA AATCTTCAAA ATCCGTTACC 6060 

ATACTGTTTT CTTCTTCATG ATAATTTAAT TTTGGATCTT TGTCTTTAGA CATAATCAAT 6120 

ACCTCACAGA TTTTTAATTA AGCAAAGCGT GACGTAAAGT AAGCTTTAAC ATCTTCAGGT. . 6180 

AAACCTGCAG CCGCTTCTTT ATCAAGAATA ACATTTACCA TTCTATGTGC TTTTAAATCG 6240 

GCTGGTTCGA AGCTTGTTTT ACCATTTTCT TGATATAATT TTTCAACTAC ATCTCGTTTA 6300 

TTAGCACCTG TCACTACTAA GAAAATTTCT. CTTGCTTCCA TTAGTCCTTG ACGAATACTA 6360 

ACATTTAACT TACCTTGCTC ATCGATAGAA ACAACTTGTA ATGTTAATTT CCCTTTATTT 6420 

45 . TCTTTAGTTT TAATCTTATC AGCGATTAAT TCGATTGCAT CTTTTTCATA AGCAATTGGA 6480 

TAAACTTGAC CTGCTGGTAC ACCTAACGCT TCGAAATATG AITTTTTATC GTCATAATCT 6540 

AAAATATTTA TTTGGCTAAA ATCAACAGCA TGTTTTTCAA CATTTTTCTT TAATTCATCT 6600 

AGAACTGGCG CTTGATCTGT ATCTAAATGA AAACCTGCAA TTGTAGTAGG ATTATTGTTA 6660 

AATTGCTTTC TAATAATATC AGCAGCATAT TCTGCTACAA GTTGACTATT GTCAAAGACT 6720 
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GATATTAATA ATTATTATAC CCTAACTTTC AATATATCAA ACCATTTAAC TTTAACATGC 6840 

TTATACTCTA AATATAGCAC TTAAGCATCA TTTTTATAAT GAAAATGACT AAATTTTAAT 6900 

TCAATCCCGG rAAATCTTGT TGACGTAACG CTTCATAAAT TAACAACGCA GCAGTATTTG 6960 

ATAAATTTAA TGAACGAATA TGTTCACTCA TAGGAATTCT TAACGCTGTG TCTTGATATT 7020 

TCrCTTTCAC CCAGTCTGGT AATCCTGTCG TTTCTTTTCC AAAAATGAAG TAAAAATCTT 7080 

TGTCATGATT TGAAAAATCA AAATCACTAT AAGTCTTTTT ACCAAATTTT GTTAATAAGT 7L40 

AATACTCGCC ATTTGTGACT TCAAAAAATG CTTCAATACT ATCATGATAC GTAATATTCA 7200 

CAAATTCCCA ATAATCTAAA CCGGCTCTTT TTAACATTTT ATCATCAGTT CTAAATCCAA 7260 

GAGGTTTAAT TAAATGTAAA TGTGTGTTTG TACCTGCACA CGTACXSgCAA TGTTACCAGT 7320 

ATTAGCTGGG ATTTCTGGTT GATATAAAAC GATATGATTT GTCATATTAC TATTCTCTCC 7380 

TTGTGTCTAA TCCTTTTATC ATTTCATTCT GAACTTCTGC ATCCTCTTGA TCATAATTAG 7440 

CATTGATAAA ATCTCTTGCT TCTTCCCCAA GAATTTGACC AATGGCCCAA TAAGCAGTTG 7500 

CTCGAATCAA CGGTCTTTCA TCTGTTGTTG CAACTTTTTT CAATTCTGGA ATTGCATCCA 7560 

25 CTTCATTAAA ATGCGCCAAT GCTAAAATAG CATTTCGTTG TATCGGCTTT TTACCACGCC - 7620 

AAGCACCTGC AAGgTCACCA TATGTTTGTT TGAATTCTTT ATTAGACATA CGTAGtAAAG 7680 

GTACTAATCT TCGCTTTAAA ATTTCTGGTT CCAAAATGAT GTCATCTTGT TCGGTATTAA 7740 

TACCTCTATT TTTCGGACAA ACTTGTTGAC ACGTATCGCA ACCATATAAT CTATTCCCAA .7800 

TTTTATAACG ATATTGGTCA GGCATATAGC CTTTTGTTTG CGTTAAAAAA CTAATGCATT 7860 

TCTGACTATT TAATTGGCCA TTTCCAACTA ATGCACTTGT TGGACAACGA TCAACACAAA 7920 

TTGTACAATG CACCACAGCT ATCTAATAAT GGATCATCAG GTTCC 7965 

(2) INFORMATION FOR SEQ ID NO: 322: 

(i) SEQUENCE CHARACTERISTICS: 
40 (A) LENGTH: 13 02 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

45 . ^ ■ ■ ' 

(xi) SEQUENCE DESCRIPTION: SEO ID NO: 322: 

GCCCTGTTGG AGAAATCACC TTTATACGAT GGTTGAAAAA GCATCATTAG GTACAATCGT 60 

SO GGCAATTATA GTTATTTTGC TGTTTTTAAG AAACATTCGT ACGACGGCAA TTTCTATTAT 120 

ATCGATTCCG TTATCACTTC TTATGGCGCT TATTGCTCTG AAATTGAGTG ATGTTTCATT 180 
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TGTAGTTGTT GAAAATATTT ATCGACGCTT AACAGATTCA GAAGAACAAC TAAAAGGTGA 
AAATTTAATT ATCAGTGCGA CAACTGAAGT ATTTAAACCA ATAATGTCAT CGACACTAGT 
TACTATTATC GTCTTCTTAC CACTTGTGTT TGTATCAGGT TCAGTAGGCG AAATGTTTAG 
ACCTTTTGCA TTGGCTATTG CATTTAGTTT ATTAGCATCG TTATTAGTGT CAATTACACT 
CGTTCCAGCG TTGGCAGCTA CACTATTTAA AAAAGGCGTT AAACGTCGTA ATAAACAACA 
TCAAGAAGGA TTAGGTGTTG TTAGTACAAC TTATAAAAAA GTATTACATT GGTCATTAAA 
TCATAAGTGG ATTGTAATTA TATTAAGTAC ATTAATTTTG GTTGCAACTA TTGTATTTGG 
AGGACCGAGA CTAGGCACTA GCmATTTC AGCAGGTGAC GATAAATTTT XAGCTATTAC 
TTATACACCG AAGCCTGGTG AAACGGAGCA AGCAGTGTTG AATCATGCGA AAGATGTTGA 
AAAATATTTA AAACAGAAAA AGCATGTAAA AACAATTCAA TACTCAGTTG GCGGTAGTAG 
TCCAGTAGAT CCAACGGGTA GTACAAATAG TATGGCAATC ATGGTTGAAT ATGATAATGA 
CACGCCTAAT TTTGATGTAG AAGCGGATAA GGTTATTAAA CATGCAGATG GCTTTAAACA 
TCCTGGAGAG TGGAAAAATC AAGATTTAGG AACAGGTGCA GGTAATAAAT CTGTAGAGGT 
TACTGTAAAA GGTCCATCAA TGGATGCCAT AAAATCAACT GTAAAAGATA TTGAACAGAA 
AATGAAACAG GTTAAAGGAC TAGCCAATGT CAAATCTGAT TTATCGCAAA CATATGATCA 
GTATGAAATT AAAGTCGA7C AAAATAAAGC GGCAGAAAAT GGTATTTCTG CAAGTCAACT 

• * ■ • * ■ 

TGCAATGCAC TTGAATGAAA ACTTACCAGA AAAAACAGTT ACGACTGTTA AAGAAAATGG 
TAAAACTGTT GATGTTAAAG TCAAACAAAA TAAGCAAACA GC 
(2) INFORMATION FOR SEQ ID NO: 323: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1003 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 323: 
ATATATATTA ATTTAAACGT GTTTCACATG TACCAGTGTT AATGACAGAT AATGCTGCGT 
TTAAACCACC TTCAACAAGG TTTTGTACTG CTTCATCAGA GAAGAAAGCA ATATGTGGTG 
TTACTAAAAT TCTTTCATGT TCGATTAACT CTAATAATGT TTTATCGTCA ATGTCTTTAT 
TAGTCCAGTC ATTTGTGAAG TATGCTGCTT CATTTTCATA AGTATCAATC GCAGCACCTA 
ACAAAGTACC ATCGTTCACT GCAGCGATTA AATCAGGTGr ATTGATGACT GCACCACGTG 
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GATAGCTTTC TTTGTTCGCT GGAACATGTA AAGAAATAAT ATCGGCATCT TTAATAGCTT 420 

CTTTAACACT ATCTTTATAA GTTAAAAAGT CTAAATCTTT ATTAGGATAG GCGTCATAAG 480 

CTGTAATTGT AGCACCAAAT CCTGCATATA TtTTAGCTGT AGCAGCACCG ATACGACCCG 540 

TACCAATAAT TGCAACAGTC ATATTTTTAA CTGGTTTAGA CATGATTTCT GCTTGCCAAG 600 

TAAAATCATG TGCTTGTACA CGGCGTTCAA TATCTGGGAA GCGACGCACT AATTGTAGGG 660 

CGATAGArAC AGAATACTCT GCAATtGTTT CAGGTGAATA ACTAGGAACG TTAGATATCA 720 

CAATATTGTG TTTTTTAGCT AAATCTAAAT CATACATATC AAATCCAGCA GTACGTTGTG 780 

75 CAATTTGTTT AATACCGTAA GATTCTAATT TAGGATAAAC GTCATTTTCT AACTTACCAA . 840 

ATTGCATTGT AGTTACGCCA TCGTAATCTT TTAATTGAtC GACTGTAGCA CTTGATAATA 900 

GCTCTTTAGA AGTAGTTACT TCGACATTAT TCTtTtTCCC CCAATTTAAT GCCATCTCTT 960 

TCTCATAATC ACGCGTaCCA AAGAACATAA TTCTCGTCAT TAT 1003 

(2) INFORMATION FOR SEQ ID NO: 324: 

(i) SEQUENCE CHARACTERISTICS: 
25 (A) LENGTH: 5030 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

30 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 324: 

GGCTTTTATA GTGTTTACGA TTATTATGAT TACTTATATT CACGCTGTTA AAAATTATCC 60 

35 AAATAACCGT ACTGTTCATT ATGGTTATAC AGCTGCATTT ATACTTGTTA TATTACAAGT 120 

■ ■ * > 

TATCACAGGT GCATTATCTA TTATGACAAA TGTTAACCTG ATAATCGCAC TTTTCCATGC 180 

ATTATTTATC ACTTATTTAT TTGGTATGAC AACATACTTT ATCATGCTAA TGTTACGATC 240 

AGTAAGAAGT GACArGCAAT AACaAAAAAG cmAACCGTAA TTTTAATGGC ACGCCCATTA 300 

AAATTACGGT nTTTTATATC AATATTTAAA AtTAAACCtA AGCCATGTAA AAACGAGATT 360 

ACACGTCAAT TGTTGTGTAA TCTCGTTTTA TnTTAATCAT TTTAGTCAGT TGCTTTTTCA 420 

ATTTCGATTA ATAAATCGCC TGTCGCTATT GTGTCACCAT TATTTACAGT TACTTGTTTA 480 

ATCACACCGT CAAATGGTGC TTGAATTGTT GTTTCCATTT TCATAGCTTC AGTAATTAGC 540 

SO AACGGCTGAT TAGCTTTCAC AGTTTCACCT ACACTAACCT TGACTTCAGT TACTGAACCT 600 

GGCATTTGAG CACCGATATG ACTTGGATTA CTCTTATCTG CTTTTGGCTT AACGTTCGCA 660 

TTTGTATGCA CATTTTCATC TTTAATGTAA ATACGTCTCG CTTGACCATT CATCGCATAG 720 
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CGTTTACCTT TATCGATTTC GATTTCTACT GTTTCACCAT TACGCATTCC AAAGAAGAAT 
GTAGGCGTAT CAAGTAACX5A TAAGTTTCCG TATTGATTTC TAGTTTGAAT ATATTGTTCA 
TATACTTTTG GATATAGTAC ATAACTAATA ATATCTTGCT CCGTAACAGG ACCTTGTTGC 
TCTTCTTCAA GCAACTCACG GACTTTTTCA AAATCAACTG GCTCTAGATA TTCACCTGGA 
CGAGCTGTTA GTGCTTCTTG GCCTTTTAAA ATAACCGCTT GTAAATCTTT ATTAAAACCA 
TTTACAGGTT GTCCTATTTC ACCTTTGAAG AACGACACTA CTGATTCTGG GAAATCTAAT 
TTATAGCCAT CTGTAATCAC GGATTGTTCA TCAAGATCAT TTTGTACCAT ATAAAGTGCC 
.ATATCACCAA CTACTTTAOA CQATGGTGTT ACTTTTACGA TATCACCAAA TAAGAAATTC 
ACTCTGCGAT ACATATCTTT GACTTCATCA AATCTTTCXSC CTAAACCTAA ACTTTTAGCT 
TGTTGACTTA AATTCGAATA CTGTCCACCA GGCATTTCAT GTTGATAAAT TTCAGTATTC 
GGTGATTTGA TATCACTTTc AAAGTCTGAA TAATAAGTAC GTACAGTTGA CCAATAATGA 
CTAAGTGACT CCATACCTTC AATATCAGTT CTAAGGTGGC GTGGGAAGCC ATTTAATGCA 
TAATATAACG AATTGGCGCT TGGCTGACTT GTTAAACCAC TCATTGAAGC AACAGCAGTA 
TCAATGATAT CGACACCAGC.. ATCTATTGCT TGTTTGTATG TTAATAAACC ATTACCACTT 
GTATCATGAG TGTGAAGATG AATTGGTAAA TCTACAGCTG ATTTTAACTC ACCAATCAAT 
TCGTAAGCGG CTTTAGGTTT TAATAAGCCT GCCATATCTT TAATCGCTAA AATATGGAAA 
CCTTCACGTT CTAACTCTTT AGCTAGTTTG ACATAATACT CTAAAGTATA AATGTTTGAT 
CGCTCAGGAT TTAAAATGTC ACCTCTATAA CAAATAGTAC CTTCTGAGAT TTTGCCCGCT 
TCTTGTACTG CTTCATTGGC AACTTTCATT TGATCTACCC AGTTTAATGA ATCGAAAATT 
CTAAAGACAT CTATGCCTGC TTTAGCACTT TCTTGTACGA ATTTATGAAT AACATTATCA 

♦ 

GGATAGTTTT TATAACCAAC TGCGTTTGAA GCACGTAACA ACATTTGGAA TAATACATTT 
GGAATAGCTT TACGTAGACG TTCAAGTCGT TCCCATGGGT TTTCCTTCAA GAAATTATAT 
GCCACATCAA ATGTAGCACC GCCCCACATT TCTAGTGAGA AACCATCTTT AAATACGTCC 
GCTGTTTTGG ATGCGATATT AATCATATCC TTAGTTCTAA CTCGTGTAGC TAATAATGAT 
TGGTGTGCAT CTCTAAAGGT TGTATCTGTT AGTAAGACAT CATCCTGCTT TTTAACCCAT 
TCAGCTACAC CTTTTGGACC TACTTCATCA AGCAATTGTT TCGTACCACT AAATGAAGCXS 
ATTTTACTTG AAGATACAGT TGGAATTGAT GCTAATTCAT AGTCTGGTTT CGGAOGTTTC 
TCAACATTTG GGAAACCATT AATTGTTACA TTACCTATAT ATTCTAATGT TTTAGTACCT 
CTATCTAGAG ACGGCTGAAT GTCGAAAAGT TCTGGTGTTT CTTCAATAAA TTTAGTTGTG 
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TTAACACCAC GAATACGCAT TTCTCGTAAT 
AATGATATCG CGTGTGTAGA TAATTTTACG 
GCACCTTGGA AACCATCTCC AGCATCAAGA 
GCAATGATTG TTCCAGTATC CGGCATGAAA 
CATTGGATGG CATAGCCTAA TGTTGTAATA 
CCAAATAAAT CGGCACCTGC TGCAACTAAA 
ACCATCTCTG TAATTGTATG CTCTACTTGT 
TCGTCACCAG ATACTAGAAA TTCAACAGTA 
AATTGAATTG CAGCATCACA AATACGTTGA 
GCAACTTCTA CAACTrrTTG ATGACGACGT 
ACGATATTTC CATGTTCGTC. ACCTATGACT 
TATCTTTCTA TGTAAACTTC ACTATTACCA 
TGGAAAGCAT CTTCTAATTC ACTTTCTTCA 
CCACTTGTGG CTTTAATCAT TAGCGGGAAA 
TCATATGATT TAATTGGACC GTCTGTACCA 
GTTGTACGAG CTTTAACTTT ATCTCCAAAC 
AATTTAATTC CTTCTTCTGC ACAACGACGC 
TAGCCAGGAT GAATCGCATC CACATTCGCT 
TTTAAATAAC TTTCAGCAGG ACCTAAATCA 
TATCTATGTA ATGAACTTTT GTCTTCATTC 
TCTGCCGCCG CTCTGAATAT ACGAATTGCA 
TTTATTTGTT TCAATAGCGA TACACTCCTC 
AATAAAATTT TATCTTAAAG CGCTCTGTTT 
TTaACATyCr tGAGACAATT AAAaCCyCCG 
TGCAACAACA GGTAGTTCCA CGTTTTTGTT 
AAAATTAAAA ATAAAATTGC AAAACATCAA 
TATCATCATG ATTCTAATTT CGCCACCACA 
ATAATTATAC GTTGTTTTGT TTATAAAATT 
AACaAAAAGG AAGTTAAGCG TTGTTTGGTT 



GAGCGTACCA TTTTTTCTTC TGCTTGTTTA 
AGTAATGAAT CATAATAAGG TGATATCTCA 
CGTACACCAA AGCCCCCGCT TGAACGATAA 
TCATTTAACG GATCTTCTGT TGTAATACGA 
TCTTTTTGTT GCGGCATATT AATCTCTTCA 
ATTTGTGTCT TAACAATATC AATTCCTGTT 
ACACGAGGGT TAACTTCTAT AAAGAAGAAT 
CCTGCATTGA CATATTTAAT ATTTTCCATC 
CGTAATGTTG ATGATAATCC AACTGATGGT 
TGTACTGAAC AATCACGTTC AAATAAGTGT 
TGTACTTCAA TATGCTTTGG ATTATCAATG 
AATGATTTTT CAGCTTCTGA TTTTGCTCTA 
CGAACGATTC TCATACCTTT ACCGCCGCCA 
CCAGCTTCTT CTGCAAATTC TTTTGCTAAT 
GGAATAACTG GTAAATCTGC CTTGATAGCC 
ATATCTAAAT GTTCTAAATG AGGACCAATA 
GCAAATTGTT CATTTTCACT TAAAAATCCA 
TGTTTTGCTA CATCAATGAT ACGCTCAATA 
CTTCCAACTA AATAGGATTC ATCTGCTTTA 
GAATAAATTG CAACTGTGCT GATGTCTAAT 
ATTTCTCCAC GGTTAGCAAC AAGTAACTTT 
AAACTATTAG AATTTTCTAA CTAATTAGAT 
TGCTATAGTt mTGTTTCmAA TTTTCAAAaT 
CTTCmGaAAT AATAATTTCA AAAATGACTA 
GTGAAACATT TTCGATTTCT ACAACTCTAA 
CATTTATTAT CAATAGCGAT AACTTTATCT 
TTTAGTAATT TTTAGTCATA AAATTTAGTT 
TGATAATCak GAGTAATCtC GTAATATCAA 
GcCTAACTTC CGTTATTGAA CTCATCcAGT 



1190 



EP 0 786 519 A2 



10 



IS 



20 



2S 



TCTCGTACTA AATATTGC3CT AGTATTTTTT TAATTAAATT GTCTTCTTAT ATCAACTTTT 

TGTTGTTGTT TCTTTCGTTG CTGGTCTACT TTGATTTGTT TACCTACAAT CAGAAGTAAA 

CCCATAGCAA TACTTAAACT AATCATTGAT GATCCACCAA AGCTGATAAA TGGCAATGGC 

ACACCAGTTA ATGGAATTGT TGCCGAAATA CCGCCAATGT TTACAAACX5T TTGACTTCCA 

AAGTATGTGG CAATCCCAAC ACACACAAGT TTATAAAAAT ATGATGATGT TTTATTTGCA 

AACTGGAAGG CACGATATAC AATAAAGAAC TCTAAAGTAA TAACTAGCAA TCCTCCGATT 

•AAACCTAATT CTTCGCAAAT AATTGCAAAA ATAAAATCTG TATGTGGTTC TGGTAAATAG 

CCCAATTTCA TTGCACTATT TCCTAATCCT TTTCCAAATA CGCCACCGTT ACCTATCGCA 

AGCAATGAAT TGGAAATATG GTATCCAGTT CCTGATTCGA ATTGGAATGG ATCTGTTAGC 

GTACTAAATC TGGCAGTTAA ATAACTTGGT AACCAACCAG CCATTAATGC AATGACAAAT 

ACTACTAAGA ATCCTAGCAC TGCTGGTATA CCAAATCTTA GGACTTTGTT 

(2) INFORMATION FOR S£Q ID NO: 325: 

(i) SEQUENCE CHARACTERISTICS: 

<A) LENGTH: 1389 base pairs 
(B) TYPE: nucleic acid 

<C) STRANDEDNESS : double 
(D) TOPOLOGY: linear 



4440 
4500 
4560 
4620 
4680 
4740 
4800 
4860 
4920 
4980 
5030 



30 



35 



40 



45 



SO 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 325: 
CTTGTTAATC CGAAAATTAT TAGTCAATCA AATGAAACAA TAACAGACTT nGAAGGTTCA 
,ATTACATTGC CAGATGTTTA CGGCGAAGTG ACAAGAAGTA AAATGATAGT TGTCGAAAGT 
TATGACGTCA ATGGGAACAA AGTTGaACTA ACTGCACATG aAGATGTAGC AAGAATGATT 
TTGCATATTA TAGATCAAAT GAACGGTaTC CCTTTTACAG AACGTGCGGA CCGTATTTTA 
ACAGATAAAG AAGTGGAGGC ATATTTTATA AATGACTAAA ATAATATTTA TGGGTACACC 
AOACTTTTCA ACAACTGTTT TAGAAATGCT TATTGCAGAA CATGATGTCA TTGCAGTCGT 
AACGCAACCA GATCGACCTG TTGGACGTAA ACGTGTTATG ACACCACCAC CAGTTAAAAA 
AGTTGCAATG AAATATGATT TACCTGTATA TCAACCTGAA AAATTAAGTG GATCAGAAGA 
ATTAGAACAA TTGCTTCAAT TAGATGTAGA TTTAATTGTA ACTGCTGCTT TTGGACAATT 
ATTACCTGAA TCATTGTTGG CATTACCAAA TCTTGGGGCA ATTAATGTAC ATGCATCATT 
GTTACCGAAG TATAGAGGTG GTGCACCAAT TCATCAGGCA ATTATCGATG GTGAACAAGA 
AACCGGCATA ACAATTATGT ATATGGTTAA AAAATTAGAT GCQQQTAATA TTATTTCGCA 



60 

120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 



55 
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ATTAGGGGCA GATTTATTAA AAGAAACTTT ACCATCTATT ATAGAGGGCA CAAATGAAAG 

^ ■ ■ 

CGTACCTCAA GATGATACGC AAGCAACATT TGCTTCCAAT ATTCGACGCG AAGATGAGCG 
AATTAGCTGG AATAAACCAG GAAGACAAGT GTTTAATCAA ATTCGTGGAT TATCACCATG 
GCCAGTTGCT TATACAACTA TGGATGACAC TAACTTGAAA ATATACGATG CTGAACTCGT 
TGAGACTAAT AAGATAAACG AGCCTGGAAC CATTATAGAA ACGACTAAAA AAGCCATTAT 

TGTTGCTACA AATGATAATG AAGCTGTTGC AATTAAAGAT ATGCAATTAG CTGQGAAAAA 

. • ' 

GAGAATGTTA GCTGCCAATT ATTTAAGTGG TGCX3CAAAAC ACACTAGTAG GGAAGAAACT 
TATATGATAG AAAACGTGAG AAGTCTTGCT TTTGACACGA TTCAAGATAT ATTAAATGAA 
GGTGCGTATA GTAACTTGCG TATCAATGAA GTGTTGTCAG AAAATGAATT AAATGCAATG 
GATAAGGCTT TATTTACAGA AATTGTCTAC GGAACCGTTA AAAGAAAATA TACGTTAGAT 
TTTTATTTA 

(2) INFORMATION FOR SEQ ID NO: 326: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2746 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 326: 
TTTGCTAATA ACAATAAAGC CAAAGCCGAT TCACACTCTA AACAGCTAGA AATTAATGTT 
AAGAGTGACA AAGTACCTCA AAAAGTAAAA GATCTAGCAC AACAACAATT TGCTGGTTAT 
GCTAAAGCAT TAGATAAACA AAGTAATGCA AAAACTGGTA AATATGAACT TGGCGAaCTT 
TTaAAATTTA TAAATTTAAT GGTGAAGAAG ATAATAGTTA CTATTATCCA GTTATAAAAG 
ACGGTAAAAT TGTTTATACT TTAACACTTA GTCCTAAAAA TAAAGATGAT TTAAACAAAT 
CAAAAGAAGA CATGAATTAC AGTGTTAAAA TTTCAAACTT CATCGCTAAA GATTTAGACC 
AAATTAAAGA TAAAnATTCA AATATCACTG TTCTTACTGA TGrAAAAGGG kTTTATTTTG 
aAGAAGATGG cmAAGTTAGA TTAGTAAAAG CTACGCCTCT ACCTGGTAAT GTAAAAGAnA 
AAGAAAGTGC TAAAACAGTT TCAGCAAAAT TGAaACAAGA GTTaAAAAAT ACAGTAACAC 
CTACTAAAGT TGAAGAAAAC GAaGCGATrC AAGAAGATCA AGTTCAATAT GAAAATACAT 
TAAAAAACTT CAAAATTwGA GaACAACAAT TCGATAACTC ATGGTGTGCA GGATTCAGTA 
TGGCAGCATT ATTAAATGCa ACTAAAAATa CAGACACTTA TAATGCACAT GATATTATGC 
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AAATGATTGA ATACGGTAAA 
CATATGAACA AGTTGATCAA 
GTGTATCTCA AAACCCTAAT 
CTAAAATTAA TGACCAAGAA 
TCCAAGATGC AGATTCAAGC 
GTTCAATGAT AGGTTACkAA 
TATCAACTAC AATTTATAAA 
ACCAATATCA ATTTATTCAT 
ATACGTCATG GCGATGATAC 
CATCAACGCA TTAAATTTTC 
GATGATACAC AGCATATCCT 
CCAATCGTTT ATGAGCGCTT 
TGGCGAGAAT TCAATTTCTC 
TATTCTTTCT CTATTAATTT 
CCCTTTTAAA TTCTTATAAA 
GACTTAATAT CATATTCAAA 
CACGTTTTTC TTTAAACGCA 
ATGTTGCATC CCCAGCCATT 
CTGCTTTAAG GAATCGTAAC 
CAGTTTCATC TTCAACTTTC 
CTTCTTGTGC ATTGTATTGA 
CGATACGTGC TAAATATCCT 
TTTGTCCAAA AATAGCATTA 
TACCGCCACC TACAGCATAA 
TTAAACGCTG TAAATCTAAT 
CATGTCCACG TTTCTTCTGG 
ATACGATAAC TGAAACGTTT 
CAACTGTTTT AGGTGTAAAC 
TCCCTTCGTA AAATTCATAT 
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TCACAAGGCA GAGATATTCA 
CTTACAAAAG ATAATGTAGG 
GACCCACATT TAGGACATGC 
AAACTTATTT ACTGGAATCC 
CTATTACATT TATCATTCAA 
AAAGTAATAT AGATATTGAT 
TTTAGTTTAC GACACAACCA 
TGGTAATTGG AGTAATCATC 
AAGTCACAAT CAATATCATA 
ATCTATTGAT AATGAAGAAA 
CATGCAAACXJ TCATCCAAAC 
AGTATAACTA ATTTAAATGA 
ACCAGCTCGT TTTTTCATTG 
TTCTCAAACT ATCTTATCTT 
ATAAAAAAGC CACCTATCGT 
ATAACTTATG GGAATTTAGG 
TCACGGCCTT CTTTCGCTTC 
TGTTGTAAAC CAGCTAAACC 
GCTGTTGGTG AGTGTTTCAT 
TCTAAAGGTA CCACTGTATT 
CGACATAAGT ACCAAATTTC 
GAACCATAAC CCGCATCAAA 
TCAGCAGCAA TCGTTAAGTC 
CCTTTTACCA TCGCGATAAC 
ACATTTAAGC GAGGGATTTG 
TCACCACCAG AACAGAATGC 
TGATCATCAC GTGCACGTGA 
GCATTGCGTA CTTCAGGGCG 

* 

TTGATTTCAT CATATTCTCT 



TTATCAAGAA GGCGTACCAT 
AATTATGATC CTTGCACmAA 
GCTAGCAGTT GTTGGTAATG 
TTGGGATACA GAaTTATCAA 
TCGTGATTAT AACTGGTATG 
TAAAGGCAGG TAAAACTATG 
AACTCACACA TCTAGAACAA 
AATTACAAAA ATCAATTrGT 
TTCTTTTTAT AGATACGGCA 
TCATTTATAT TCTTGATTAT 
AAGGTATTGG CACTTCGCGA 
TTTCACTTCA TAAAGCGGGT 
TAATAATAAT CTTTAACATT 
TATGATAATT AATTAAAATG 
CGCTAATAAA CGACGCAAGT 
GAATTGATCG AAGTCAGGAT 
ATCAGTTGTG TAATAAAGCA 
ATCTGTGTCA GCATTCATAG 
AATCTCTTTA CACCATTGCA 
TACTAGACCC ATATCTAAAG 
ACGTGCTTTC TTATGTCCAA 
TGAACCTACT TTAGGACCAG 
ACAAACAACA TTTAGTACAT 
CGGTTTTGGA ATAATACGAA 
GTCTTCACCT ACATAACCAC 
TAAATCACCT TCACCAGTTA 
AAATGCGTCA ATCATTTCAG 
ATTTATTGTT ACCTTAGCAA 
AAGTGTTTCC CATTGTCTGT 



1193 



EP0 786 519 A2 



TCCACATGAA TTGTATGACC TGTAGCAGAA ATTAATTTAC ATTTACTATT AGGAATTAAA 
TTTGCCATTT TTTTCGCAAT CTGTACAAAT TTTTCATCAT ATTCTCCAGC TAATATTAAT 
GTTGGTACTT TAATTTCTnT CAGCGCGGCC ATAAGTTTGG CATTTG 
(2) INFORMATION FOR SEQ ID NO: 327: 

(i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 900 base pairs 

(B) TYPE: nucleic acid 
to STRANDEDNESS: double 
(D) TOPOUXSY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 327: 
TAATGTTTAG TTTATTAACA GTAAGTTCGT ATATCAATGT TTAGTGCTCC CCAAAATTGA 
AGTTTGAATT TTAAAAGCAT. CTTGTAGAAT TTAGTTGTAT TTTTTTCAAA GAAATTCATT 
TTGATTATTT. TTGATAATGA GCATTTTAAT AGTAATACAT GTTTATAGTG TGTAGTATAT 
GTCTATACTA GTAGTAACTA TATAGAGAAA GTAGGAATAA ACTATGTCAC AAGATGTAAA 
TGAATTAAGT AAGCAACCAA CGCCAGATAA AGCAGAAGAT AACGCATTTT TCCCATCACC 
ATATTCCCTT AGTCAATATA CAGCACCTAA AACAGATTTT GATGGTGTTG AACACAAAGG 
TGCCTATAAA GATGGTAAAT GGAAAGTATT GATGATTGCT GCTGAAGAGC GATATGTATT 
ATTGGAAAAT GGAAAAATGT TCTCTACGGG TAATCATCCT GTTGAAATGT TATTACCTTT 
ACATCATTTA ATGGAAGCAG GTTTTGACGT TGATGTTGCG ACATTATCTG GTTATCCAGT 
TAAATTAGAA TTATGGGCTA TGCCAACTGA AGACGAGGCA GTTATAAGTA CTTATAATAA 
ATTGAAAGAA AAATTAAAAC AGCCAAAAAA ATTAGCAGAX GTGATTAAAA ATGAATTAGG 
ACCTGATTCA GACTATTTAT CTGTCTTTAT CCCAGGCGGA CATGCTGCAG TTGTTGGTAT 
TTCTGAAAGT GAGGACGTTC AACAAACATT AGATTGGOCA TTAGACAATG ACCGCTTTAT 
AGTTACATTA TGTCATGGAC CAGCAGCACT ACTTTCAGCA GGGCTTAACA GAGAAAAATC 
TCCATTAGAA GGATACTCTG TTTGTGTCTt CCCTGaCTCA TTAGATGAAG GTGCAAATAT 
(2) INFORMATION FOR SEQ ID NO: 328: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3642 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 
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ATCTGAnTnG AGATAGTGAT 
CaTCaGCTAA CaCtTCaTTa 
AAAATGaTGa CtTTTCAACa 
CAATTTCCCC TGTTTGCTTC 
TGTTAAAAAC AGATTCTTGC 
CTTGCCACTT ATCAATGCCT 
ATAAAAATAG CAAGTAACTA 
TGTTGCGCCG TATTTCATTC 
TAAACATTGT TTATATTCTT 
TACACTTATC CTTCATTATA 
AATTAATTGT CTATTATTTT 
CTACATATAC CTTTAAGTAC 
TTTAGGATCG AATTGCTTAA 
TTTATAGTTA TTGTTGTAAA 
GATATATTTC TTACCGAAAT 
TGTAGCTTCT TTTGGATCTG 
ATGATCCTTT TGAACCATTT 
TAAAATATGA CTCTTCTTAG 
CTTTAAATCT TTTTCTTTAT 
AGCATATTTC AAGAATTCTT 
TTCATGCCAA CCTTCTGGGA 
ATTATCTAAA ACTGTTTCAT 
CTTTTTAATC TCTTTATCTA 
TTTTGCTTCA GCTGAATTTT 
CGCCTTTTGT GATGCTGGTA 
GGCAAACGCT GTAGAATTTG 
TGCTATTGCA ATATACTTTG 
ATACAGTTAA AATTATAAAT 
.TATTATTTCT TGgAAAAGCT 
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AATGTGTCAC CcAATTTTaA 
TCtTTAGCCG cTTTATGcCC 
CCGAACaCTA AAACaTTGtC 
AAAGTAGCTT GCTTCTTGTA 
ACAGTTTGAT TGGCATCTTT 
TCTITATTCA TATTGATAAG 
ATCATCGTTA ACACACCAAT 
CAAGCTAAAA ACATGCATTT 
AGATGCACGT ACGTCGTGTT 
CCCGAACTTT TTATATTAAA 
TGTACGGTAC ATTTAAAATT 
ATGTAGACGT CCAATTCATA 
TAGCATTTTT ACGTAATTTA 
TCGTAGCTTC CCAACTACCA 
CGTCTTTATG TTTTTCAATT 
TAAAGTCTAA TAAATTATCT 
GTCTGCGTGA TTCTTTACTC 
CTTGAGGGAT ACCTTGTTGT 
CTCTATCAGA AATATAGTAG 
TTGCGCCATA GACAGGTTTA 
AAGGTTTATT ATGTATTGAT 
CTAAATCCAA AGCAATAGCT 
ACTGTGTCTT TGCACTGTTA 
GATACCAAGC CACTGCCATA 
TAGAAGCTTG TTGCGTTTGT 
TCGTTTGTGG TGCTGAAACT 
AAATTTTATT CATCTTATCA 
GCATTTATTT AATATTGCTA 
AACAAATATG TGAACATTTC 



AcCtTTATTT TTaAGcGtTT 
CTCtATTAAA CtCGGaACtA 
tTTTTGATGG CCaTTAGACA 
TTTATTTTCA ATATCTTTCT 
ATTTAGAACA ATGGCATCTG 
ACCATTCX3CC AATCCAGATA 
AATTAGTCCA AACTTCAATT 
CTCTCCCTAC TACTATGATT 
GCGCTCTGTA ATGTTATACA 
AGCAAATTTA TGGAAAATGC 

• « 

AAGGATCAAT TTAAAAACGC 
TATTATTTAA CTTCGCCTGT 
TCTTTTGCTT TrTCACTTGC 
TACATTGGGT TAGGGAAAAT 
AATGCTTCAC GAGATTCAGC 
CCAAATAGCA TGACAAGTTT 
TTATCATCTT TACCTTTTAG 
TTTAAGTTCT TTTGTGTTGC 
ATATCGACAC CTTTTTTGTC 
GCTTTAGCAG CTTGTACCCA 
GCATAGCCTT GATATGGAGA 
AACTTATGTT TACCTTTATT 
TAACCTTGTA AATATAATGC 
ATATTTTGAT TACCAAGATT 
TGAACTTCAG CAGAACTTTT 
GTAACCGCTA CCGATAATGA 
CCTCATGATT AATATTTAAA 
TACTATGAAA AGATATTTAA 
ATATAAGCAT GATTTAATGG 
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GTGACTAGGC 


CTTCCTATCA GACATATTCA CTCATCCACG TATCATTATG TGTACAGTGT 


1860 




GCTATCTCTT 


ATTTACCTAT TGGAACAACC ATAAACTCAT CCATAGriTA 


CCTTTTATAA 


1920 


5 


ATAGCAGTCC 


• ■ 

TCACTCATAC AATTTCTCAT AAAAATCACA ACGCTCCAAC 


GTATTTCCAA 
TCCAATAATA 


1980 
2040 




CTTACTTTCA 


CCTATTTTAA TTCATAAAAA CGACACTTTA ATTGTCATTA 


10 


GCAAGACGTT 


ATTATTGCAA TCTiTTTTAT AAAATAATAG AATCATAGTA 


TTGTCATTTA 


2100 


AA6ATAAAGT 


AAGAACGTTT TTATTTTTCA GATTTTTTAA ATTATTATGA ATATCTAGTT 


2160 




TTAGGAAGGA 


lATTACATTG AAAAAACAAG TTATTATTTC GGGCCTCATG 


TTATTTTCAC 


2220 


1$ 


TA'rmTTGG 


AGCCGGAAAT TTAATATTCC CGCCCATGCT TGGCCATACA 


GCGGGTCAAA 


2280 




ATATGTGGAT 


TGGTATGCTA GGCTTTGCCC TTACAGGCAT ATnACTCCCC 


TTTATTACTG 


' 2340 




TTATTGTTGT 


TGCATTTTAT GATGAAGGTG TTGAAAGTGT AGGCAATCGT 


ATACATCCAT 


2400 


20 


GGTTCGGGTT 


TATTTTTGCT. GTCGTGATTT ACATGTCTAT CGGAGCATTT 


TACGGTATTC 


2460 




CACGTGCTGC 


AAATGTCGCG TACGAAATTG GTACAAGACA CATTTTACCT 


6TGCATAACC 


2520 




AATGGACTTT 


AATTATATTC GCAGCAATCT TTTTTGCCAT CGTTTACTGG 


ATTAGTTTAA 


2580 




ATCCATCGAA 


AATCGTTGAT AATTTAGGTA AATTATTAAC ACCGTTATTA 


CTATTAATGG 


2640 




TCGCTCTATT 


AAGTATTGCT GTCATTTTCA ACCCTGAATC TGCACTAAGT 


GCACCTAAGG 


2700 


30 


ATAAATATAT 


AACACATCCT TTCATTTCAG GAAGTTTGGA AGGCTAlTri' 


ACAATGGATC 


2760 


TTGTTGCTGC 


GTTAGCTTTT TCCGTAGTCA TTGTCAATGG CTATAAGTTT 


AAAGGCCTCA 


2820 




CAGATCGCAT 


GAAAATTTTA AAATATGTCT GCTTTTCAGG TCTTATTGCA GCCATATTAC 


2880 


35 


TTGGAATGAT 


TTACTTTGCA LTi'GCATACG TTGGGGCATC AACAGCTCCA 


GGAAACTTTA 


2940 




AAGATGGTAC 


AGATATATTG ACGTACAACT CATTACGATT ATTIGGTTCG 


TTCGGTAACC 


3000 




TCGTATTTGG 


AATGACGGTT ATCCTTGCAT GCCTAACAAC ATGTATAGGA 


CTCGTcAATG 


3060 


40 


tTGCGCCACA 


TTTACTAAGA AACACGTACC TAAGTTTTCT TATAAAATAT 


TCGCACTTAT 


3120 




TTTCtCTATC 


ATAGGGTTCT TATTTACAAC ACTTGGTTTA GAAATGATTT 


TAAAAATTGC 


3180 


45 


TGTCCCATTA 


TTGACTTTAA TATATCCCGT GTCGATTGCA CTTGTACTCA 


TATCATTTGC 


3240 


TAACATGTTT 


AGCACATTCA GATTCAGTTG GGCCTATCGA CTCGCAACTG 


TTATTACATT 


3300 




GATTATTTCA 


ATTTTACAAA TACTAAATAO TTTCAACTTA TTACACGGTG TTATTTTGAA 


3360 


SO 


ATCGTTTATG 


ATGTTACCTT TAGCAGATAT CGATTTAGCT TGGCTTGTAC 


CATTCATGCT 


3420 




CTTTGCTATT 

* 


ATCGGTTTCA TAATCGATGT ATTTATACGC CGTCCGAAAC 

* 


AAGCGACAAC 


3480 




TTAATAAATG 


CTCACTGCCT AGTAATGATT GACCCATCGT TACTAgGCTT TTttATATGA 


3540 



55 
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TAAAAAATCC TAGCTGTTAT TCAAAAATAT TAGnTTTAA AA 

(2) INFORMATION FOR SEQ ID NO: 329: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2187 base pairs 
(3) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 329: 
TTATTGATAT TGAAAATTCA AAAACTGCAA CACATCTTAT CACTAAAAAC CAACACTATC 
ATCAAACTGA CACTCATTTT GAACAGTATA AGAAATTTAT TTTAGATTCA GGTATATCAT 
CAACACAATT TGTATATAAT AACCTGTCTG TAAGCGGATT TAAATATACT AATGATGGTA 
AGAATCCAAT TCAATTATCT GACATAGTGT ATCACTTAAT CGCATTATTA CGATATGGCG 
GTGGCATTAG CTATCAATTA TTAGATGACC ATTCAAATTA TATTTCCTTG TACAACAAAT 
ATGGTAGCCC CCTACCATTA ATGCATTTAT ATAAAATGTT TAGACCTTTT GTTAATGAAG 
ATATTGAAAT TACAAATAAT TATGTATTGA .GTCGTAAAGA TAATAACTAC CATTTCTTAT 
TATTCAATAA AATTAATGAT CGATATATGT CAGACGTAAA ACAAGATTTC ATTTTCCATA 
ATGAATTACC TCAAGACTCT TTGATGATTA TTAAAACATT GAATCATGAA CATGGTTCAA 
TTCAACATTT GCTTCCAATA AGCGATCAAC TTGTTTATAT AGAAAAAGAA ATTTTAGATG 
AATTAGACAA AACGAATTAC CCTAAAACGG AGCTTGCAGT TCAAGAAGAA ACTGGTCGTA 
CATTTGAACT CAAGTTAAAT CACGACGAGG TTAAATATAT TTGCTTTAAA CCAAGCTAAA 
TACTAACAGT CCTCTTGTGT TTAGTTTCTT ACGTTAAAGG CTATTTATAT CATAAGGAGA 
TGATTTGTAA TGAGTAACTC ACAAGCAATT CAAGCAATTG AAAACGTGTT AGTAAOGTCA 
AAAGTTGGTG TATTATCAAC TGCATATAAT AATAAnCCTA ATAGTAGATA TATGGTCTTT 
TATAATGATG GTCTTACTTT ATATACTAAA ACGAATATCC ATTCTGCTAA GGTCAAAGAA 
ATTAAAGATA ATCCAGCAGC ATATGTTTTG TTAGGCTATA ACGACACAAC TAATCGTAGT 
TTCGTTGAGA TGGAAGCGAC AATCGAAATC GTTACAGAAC AAGAAGTGAT TGATTGGCTA 
TGGGAAACAC AAGACAAAAG CTTTTTCAGT TCAAAAGAAG ACCCAGAGTT ATGTGTTTTA 
AGAGTAGTTC CGCAATCCAT TAAGCTAATG AATGATAAAT CATTAGATAC ACCTATCAAA 
ATCGATTTAT AACACAAAGT GTATATAGGA AATAACTTTT ATGAATTCTA GATATAACAA 
TGTTAAATAC TTAAAATAAC TCGCTATAAT TAAAGTOTTT AATATGTTTA CAATTCAATT 
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TTTAAATTAA TTTTATGTAA TATAAATACT GCATTTGCAA ACTGTTGCAC TTTTAGGTAT 
AACAGAATTA ACTACATTTA AGGAGATTGA TGAACCATGA AAAAGAAAAA AGGTnTGGT 
CTTGGTATTA GTTTAATCGC CATCATGTTA ATTGTATGTA TTGTATTAGT AATCATGATG 
ATGACTGGCG GAAAGAAAGA TACATACTAT GGAATTATGA AAGATAATAC TACTATTGAA 
AAAATGATTA GTGAAAAAGA . TGAAAGTATT GAAAAAAATG TTAAATTACC TTCAGATTCA 
GATGTTAAAG TTAAAAAAGG TGATTTTGTA ATTGTTTATA AATTAGCAGA TTCAGATAAA 
ATTGTTAAAG TTAAAAAAGT TGACCATGAC GATGTACCAC ATGGTTTAAT GATGAAAATT 
CATGACATGG GCAAAATGCA CATGAAACAC TAATTGTAAT TTAAATTACA AATTTTAGTT 
GCCATCAAGG TATATACGAG TAAAAGCAGC GGTAAGTTGA TTTCCAATTT GGAATCATTT 
TACTGCTGCT TTTTATATTT GAAATACTTT CATATTGAAT AGCTCCACTT GCCGTTCGCC 
TgcgCTTTGC GCATGCATAA AAGCCCCTAA CAACCTGAGG TCACTGCGCT CCGGTTCGCC 
TGcgCTTTAG CGCATGCATA AAAGCCCCTA ACAACCTGAG GTCACTACGC TTCGGTTCGC 
CTGCGCTTTA GCGCATGCAT AAAAGTCCCT AACAACCTGA GGTCACTACG CTTCCGTTCG 
CCTG.CX3CTTT AnCATGGCCA TAAAAGC 
(2) INFORMATION FOR SEO ID NO: 330: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 17 88 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 
(DJ^ TOPOLOGY: linear 



X440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 
1920 
1980 
2040 
2100 
2160 
2187 



35 



40 



45 
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(xi) SEQUENCE DESCRIPTION: 5EQ ID NO: 330: 
CCnCCTTTTT AAACCTGGnG AAATGtmCAG tTTTGATGGt ATTGGGtTCT TTAGTATTAT 
GCTTAAGATA GAGTGTAATA CGCTCCTGTT GTTCTTTATA GTATATTGCT TTTTGTTTTT 
CTTTTTCGTC ATATTTCACT TTTAAATAAA TGACTGATGC AACTATACAT ATACATAAAA 
TGACACCAAT AATTATAAAA ACATGTTTTT TGTTCATTAA AGTAACTCCT AAAATGTGGT 
GGAAAATGAA AAAATTTTTA TAATCTATAA TTATGAACAT TACAGATTAT AAACCATAAC 
ACTAACATCG TCGCCTTCAT TAACTTGATT GTTAAAATCA GCAATTACTG AGAATTGTAC 
AAGGAATAAT TGCCTATTAT GCCCTCATGT AATTATTGCC TTACTAACAT TAACAAAATC 
GATAGCTATT ACATTAAATG CCTATACCCC AGACCTCAAA CACCTTTTTA TACAGGACGC 
ACTGTAATTT CATyyACGTT AACGTGCTTT GGTTGTGTTA ATGCATATAA TACTGCTTCT 
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GTATCTACCA TTCCTGGAGA AATGCTTGTT ACTTTAACGC CTGTCTTTGC CAACTCTTTT 
TCTAATCCTT GAGTAATAGT GTGAACTGCT GCTTTCGTCG CACTATAAAT CGTACTACTT 
TTCGTTACTT CAAAGCCAGA AATAGATGcA ATGTTAATAA GATGGCCACT TGATTGTTCT 
AACATAGTTG GTAATGCAGC CTGTGCCGTA TATAAAGTGC CTTTGATATT CACATCAATC 
ATACTATCCC ACTCATCTAC TTGATAATCA GTAATCTTAG ACGACAACAT TTGCCCCGCA 
CTATTGATAA CAATATCCAA ACCACCGAAT GTTTGTTGTG CAATTTTTAT CAATTCATCG 
ACTTCTTCTT TATTCGTTAC ATCTGTTGGC ACTACCTTCA CACTATCTTG TGACAATTGA 
TTCGCTACGT TTTGTAATTT TTCTTTATTT CTACCTGCTA AGACAACTTT TGCCCCTTCT 
TCATGTAGTA ATGTTGCAAT TGCTTCTCCA ATACCACTAC CTGCACCTGT AACTACTGCT 
ACTTTATCTG TTAATACTGT CATAATGATC GACTCCTTTG ATTCTTTTTA TTTTTTCAGG 
GTAAATCATA AATACATATT ACTTTTAAAA AGCGTATCAC AATTCATATA ACGGTCATAA 
TAACTCGCTT CATTTTCATA GATAAATTAC ATTACAAGCC ATTCGAAACA TACAATTAAT 
CGTTGCTTAT ATTTTTTATT TTTAAAAATG TTGAAAAATC GTCACTTCTT TATTGTAAAA 
ACATTATATT AGTAATAAAG TTAATACTGT GnATTTaTCA TTCGATTGAA TGATTAGAGG 
GAGGAATAAA ACgTGACATA TCATGAGCGT GTTTTAGCAT TAAGAGCAGA AAGTAAAAGA 
ACCGCATTTG ATTTTCGATT CGAAGATTTA TTTAGCAAAG AAGAATGGcT AAGTATGTCT 
CTTGCAGAAA GACAAAAAGC TGAAAAAGCA TTTCGACACG AgTTAAAAAT ATGGACGATG 
TAAGAATGCC CTTCTCAAGT GTCCATGACG CCCAAGTAAA ATTATATAAT GTTGTATATT 
CTTATAACGG CaTTAAACGT AATTTTAAAC AAGTTGAAAA TGGAAGGATT CTAATATCAT 
TTCGTTTATA TATnGCAGAC CATGGATAGA ATTTTnTATG GTnAATCC 
(2) INFORMATION FOR SEQ ID NO: 331: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH; 1341 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 
{D) TOPOLOGY: linear 



660 
720 
780 
840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1788 



50 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 331: 
TAAGCCAAAT CCATTGTTAC CAGAAGAAGT TCGCTTCATC TTAAAACAAA TGGGTCTTAA 
AGAAAAGACT ATCGATGTTG AACTCGAAGT TGGCGAGCAA GTTCGTATTA AATCAGGTCC 
ATTTGCGAAT CAAGTTGGTG AAGTTCAAGA AATTGAAACA GaTAAGTTTA AGCTAACAGT 



60 

120 
180 
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GCTTTAATTA ACAATTAAAG TTATTAAACT AACCAAAAGA TAAAAAAGAG TATTGATTTT 
TTAATTAGAA AAGTGTTAAA ATTATGTGGT cGcGCTTTTA GAGCGCCCAT TTCGTcACGA 
AATGTTAAGA GTGGGAGGGC AAAACTGAGC CCTGTGACCA CATCACGATA TCAAGGAGGT 
GCACATCGTG GCTAAAAAAG TAGATAAAGT TGTTAAATTA CAAATTCCTG CAGGTAAAGC 
GAATCCAGCA CCACCAGTTG GTCCAGCATT AGGTCAAGCA GGTGTGAACA TCATGGGATT 
CTGTAAAGAG TTCAATGCAC GTACTCAAGA TCAAGCAGGT TTAATTATTC CGGTAGAAAT 
CAGTGTTTAT GAAGATCGTT CATTTACATT TATTACaAAA ACTCCACCGG CTCCaGTATT 
ACTTAAAAAA GCAGCTGGTA TTGAAAAAGG TTCAGGCGAA CCAAACAAAA CTAAAGTTGC 
TACAGTAACT AAAGATCAAG TACGCGAAAT TGCTAACAGC AAAATGCAAG ACTTAAACGC 
TGCTGACGAA GAAGCAGCTA TGCGTATTAT CGAAGGTACT GCACGTAGTA TGGGTATCGT 
TGTAGAATAA TTTTACGAAT ATTAAATTTG ATTACATGAT TTAAACGATG AAGCAGATAA 
CAGAGATAAT AATGATGAAT TATAAATATA ATCTGAATGA CTAGATTAAT GATTGATTTA 
TTCATAAGAT TAATTCTTCT GTTGTCTGCy CTTAACTTGC ATATAGCAAG TAATGTGGGA 
GGAAATTCCG CTAAAACCAC TAAAGGAGGA ACTATAAATG GCTAAAAAAG GTAAAAAGTA 
TCAAGAAGCA GCTAGTAAAG TTGACCGTAC TCAGCACTAC AGTGTTGAAG AAGCAATTAA 
ATTAGCTAAA GAAACAAGCA TTGCTAACTT TGACGCTTCT GTTGAAGTTG CATTCCGTTT 
AGGAATTGAT ACACGTAAAA ATGACCAACA AATCCGTGGT GCAGTTGTAT TACCAAACGG 
AACTGGTAAA TCACAAAGTG TATTAGTATT CGCTAAAGGT GACAAAATTG CTGAAGCTGA 
AGCAGCAGGT GCTGACTATG T 
(2) INFORMATION FOR SEQ ID NO: 332: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 5135 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

• (Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 332: 
CTCTAAATCT TCAATAGGTA ACTTCATTTT AATAATTCCC ATTTGAACAA TTGCTTCTTC 
ATCATTGACA ATTTCTAAAA CTTCACCCTT TTGACCGTAA GAkAATACTT TkACTTCATC 
ACCAGCAACA ATTTTATCGT ATTTTTGCTT TTGTACATTT TGCTTTATAG ATTTCGCTTC 
ATAATGATCA TCTAATCGTT TCTTCTTATC AATCAATTCA TGTTCTTTAA CATCTGCACC 
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10 



15 
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CTTAATCTTC TGATTTGCTT TkTCTTTCGC TTCCTCTATT AGAGACTTTT CATAATTTTG 360 

GAATTGTTGA TACTGCTTAG ATAAATCATC ATGCACTTGt CCGCkTslcTT TACAAGACGG 420 

TCCAGkTCTA ACCTCTGTGT CTCTACACGT TTGTAATTAC GCTCTAATGA TTCAATCATT 430 

TCATTTATTT CTTTTTCATC AGTACCAATC ATCGTCTTAG CCTTATTAAT AATATTCAAA 540 

CTAAGACCTA ACTTTTTAGA AATGTCAAAA GCATTTGAAC GACCCGGCAC ACCCATTAAT 600 

AACTTATACG TTGGACTCAA AGTATCTACA TCAAATTCTA CACTCGCATT CATAACGCCT 660 

TCTCGATTAT AACTATATGC TTTAAGTTCA GGATAGTGCG TCGTTGCCAT TACTAGAGAA 720 

CCAATTTTTC TAACATGATC TAAAATGCTC ATTGCTAATG CAGCACCTTC ACTCGGATCT 780 

GTACCTGCAC CTAATTCATC AAATAAAACT AAACTATGTT TGTCTGCATG CTTTAAAATT 840 

TCAACTATAT TCGTCATATG AGATGAAAAA GTTGATAATG ATTGTTCTAT TGATTGTTCA 900 

20 TCTCCGATAT CGCAATATAC ATTTTTAAAT ACACTTAACT GACTACCATC AAGTGTGGGA 960 

ATCAACAATC CTGATTGAGC CATAACAATA ATTAAACCTA ATGTTTTTAA TGTTACAGTT 1020 

TTACCACCTG TATTCGGTCC TGTAATAATT ACCGTTTCAA TATCTTCCAT AAATTCGATG 10 SO 

GTATTAGCTA CAACAGTCTC ACGATTTAAT AATGGATGGT ATGCTTTAGG TAAATATACA 1140 

GTACGGTCCT CTTTAAATAT CGGCTTTGTT CCTTTAATAC TTCTACTATA TCTCGCTTTT 1200 

GCGATTAAAA AATCTAACTG ACCCATGACT TGTTCTGCCA CAAGTAGTGC ATCTTTGTCC 1260 

GCAGCCACAT AACCAGTTAG TTGCGTTAAA ATGCGTTCTT TTTCAATTGC TTCGTCATGA 1320 

CGTAATCGAC TAATTTGATT ATTCATTTCA ACAACTGATG ATGGCTCAAT ATACAATGTT 1330 

35 TGTCCTGAAG CAGATTGA7C ATGTACAATC CCATTAAAAT CTTGTCGATA TTCAGCTTTG 1440 

ACAGGTATAA CGTTTCTTTC ATTCCTAACT GTTACAATAG CATCTGATAA TTTTTTCTGA 1500 

TTTGCTTGGC TTTTAACAAT ACGGTCCAAA TTTTGTCTAA TACGTTGATT CGTGCTAGAA 156 0 

ATTTTACTTC TAATCCCTTG CAATTCATAA CTCGCATTAT CATATAAATC ATACGTATCG 1620 

CATGTTTCAT TTATTTGTTG AAAAAGATCA GTTAACACAG GTAATTGATT CATCTTGTCA 1680 

TCTAATATTG GGTATTTAAC ACCTTCATCT TCTTCAACCA ATTGATTATA AAATGTCTTG 1740 

AATTGATTTT GTACTTGAAT TAATCTTTTT ATCAAGTTAA GCTCTGATAC ATTTAAAACG 1800 

CCGCCAATAT CAGCGCGATG AATGAATGCT GATACTTTAG ATAAGCCACT CAAGCTTGGT 1860 

so AAACGATGCT TATTATAGAT TTGAGCAATC TCATCCGTTT CTTCCATTTG AAAAACAACC 1920 

GTTTCAAAAT TAGTAGCTGG CATCATTTGA TTGACCTTTT CCAAGCCTAA GTCACTAATA 1980 

GTTTCATTGG CAACGAGTGA TTTTATTTTT TCAAATTCTA AGACGTCTAA TGTTTTTTGT 2040 
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TCACGCGATA ATGCGTTAAT CACTCTATCT 
CGCCATAATT CATAAAATCT AAATGATTTG 

5 

TCACATTTGG ATATTTACGA ACGATATCAG 
TAATTTCTAA TACTGTATTC GTTTCTTCAG 
TATAACCATC TCTTCTACCT ATAATACGCC 

10 

GATTGCGACA TGCATTAGCT AATCGTTCCA 
GATGAATAGC TCCAATTACA TAATCAAGTT 
15 AGCCATCAGG TAATATATCC ATTTCTGTAC 

TATCTAAAGC CTTAATTTCT TCGTTTTGTC 
CAACACGTAA ACTTTGTGAA TGATCAGTAA 

20 

TTGCTTCTAC CATGTCTCGA ATAGAAAACG 
TATCACCATT AATATCATCT ATTGTAATGA 
CATCTTCTCG CATAGCAGGT GGTATAAAAT 

25 

CACTATCATA TTGAATTAAT GTACCATCAG 
CATCACGTGC TTTAGCAAGT TGTCGAATTC 
GCTGCAATGT ATGATAAAAA GCACTTGGTT 
CATCATCATA CGCTAATTCT AATGAAACTT 
TATTGGGAAT ATTTAATAAT TGCTGCTGCA 
^5 AATCTAAATC TTTGCTCATT TCTTTAAAAC 

CGATATAATT TAATGTATCT ATATAATCAA 
CAATTGGATA TCTATCTTTC TTAGCACCAA 

40 

CCGTTTTCTT AGCAAATCCG CTTAATTCAC 
GTGACGCTTT ATCAACAATA TTCAACTCTT 
GTCCTTGAAT TTTCAAAAGT GGAATAAGAC 

4o 

AATACTGAGA TTCACCGGTC TCACGGTAAT 
TGCCTTTtAA CTCCGTCACA TCAGATATTT 
SO TTTGAGCTGC TTTTCGaTAC GCTGaTATTT 

AAGTAGCAAT TTGTTCTAAT AGTTTGATAA 
AAAAGAAGAC CAGGACGTAT CATTAATATA 

55 



TTTGTtACAA ATCCTTTTTG CGCAGTTGtA 2160 

TATGATGCGC ATCAGTGTTA ATAGTTAATT 2220 

CGCTCAGATC CAGTCGATGT GGATTGGCAT 2280 

CTAATGCCAT TAATTGTTCA ATATTCGGTT 234 0 

CTGTTGGATG CGCTATATGT CGCACGTATG 2400 

TAATTTGTTC TTCTGATTGG TTAAAGCTTT 2460 

GTGCTAAAAT TTCATCATCA TAATCCAGCG 2520 

CTGAATAAAT ATCAATTTCA CTATATTCTT 2580 

TTAAAAGTCT TTCTACTTGT AAGCCATTAG 2640 

TTACCATGAA TTTATAACCT TTTGCGATAT 2700 

CACCATCACT ATACGTTGTA TGCATATGAA 2760 

TATTACTTAG ATCTTTATCA AATTCGCTAC 2820 

TCACATTAAA ATGTTCATAT ATCTTG6CTT 2830 

CTTGTTCAAT TCCATATTCA CTTACTTTTT 2 940 

TTATATTATG TTCTTTTGAC CCAGTAAAAT 3000 

CAATTAATCG AAAATCGACA CCAATCGTTT 3060 

TTGTGTTCCC CACTGCAACT TCTTTTACTT 3120 

CTGCTTTTGG GTTATCGGTA CTTATTATGA 3180 

GACGGAAGCT TCCTGCAGAT GAATATTGAT 3 240 

TGATTTCTTG ATTAAGTCTT CTCATTTGAT 3300 

GTTGTTTCAC AGCTTCTAAT ATGTTTTGTT 3360 

TAACTTTTCC ATTTTCACAA GCAACTTGAA 3420 

TATATAGCTT AGCAATTTTC TTGCTTCCAA 3480 

CTTCCGGAAC TTCTTCCTGT AATTGCTGTA 3540 

CATTGATTAC TTCTGCAACA CCTTTACCAA 3600 

CATCTAATGG TCGTTCATCT AATTCAAGAC 3660 

TAAAAGTATT TTCCCCTTTT AATTCCATAT 3720 

CATCTTTTTT TGTCATAATA ACACTCCATA 3780 

TACCTTTGTC CTGACCTCTT ATGATAATTT 3840 
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TAGATATTTT 


AAGCTGATGT 


TGTAATGCTT 


CGTTAGGATA 


TAATGCCAAT 


AGATATAACG 


3960 




TAAAGTGTAA 


GACAATTATC 


GTCATAAACA 


CACCAACTAT 


CATTCCCATT 


GCACGACTGA 


4020 


5 


AAATATGAAT 


GTTTTGATAC 


GCTATTATTT 


TATCAAAAGT 


TACGATAATT 


AGATATAAAA 


4080 




TGAACTTACA 


AAACAATGTA 


ATCATTAAAA 


AAGCTACAA7 


CGCTTCAAAT 


CGATTTTGTA 


4140 


10 


GATGATTAAA 


ATGAAACGCA 


AAAGTTGTAT 


TAAATGCTGT 


TGTTTTAGGA 


TATGGAATAA 


4200 




ATACAATTAA 


TCTTTCTACA 


ATAGATTTGT 


AAAATTGACT 


GGCAATCCAC 


AATGA7ACAA 


4260 




nCGTTGCACT 


CAAATGTATC 


ATAGATAACC 


AAAAACCTCG 


TCTGAATCCA 


ACGATGACAA 


4320 


15 


AATACACAAA 


GAAAATGATT 


ATGATAAAAT 


CAATGACCAT 


TTATTGCTCA 


C6CTGCTGCA 


4380 




ATTTGTGAAT 


TTGTTGTTTC 


AAACGTCGAT 


TTTTTTTCTT 


CTAGTAGTAC 


TTTTTCATGC 


4440 




ATAATATTCA 


CAGCAGTTAG 


TATTGCTTTT 


CTTGAAGTAT 


CTAAACCTGC 


TGCTTTATAC 


4500 


20 


CCTAATTCTT 


TTATTTTATC 


ATCAACTAAA 


TGTGCTACAT ATCGTATGTG 


CTCTGGGTTA 


4560 




TCTTCCCCAA 


CAATTGTAAA 


AAGCTGATCA 


TTAATTGATA 


CATi'TACCTT 


GTTTTTAAAC 


4620 


25 


TGTGTCATTT 


ATAATTTCTC 


CTGATCCTTT 


TTTTAAAATC 


TAAATTCACG 


TTATAAAATA 


4680 


TGACTGGATA 


GTTTGTCTGA 


ATTTGATACT 


AATATTGTTA 


TATTGCAATT 


ATGATAAAAC 


4740 




AACAACACAA 


TCTCTATAGA 


TGACTTAATG 


TTCTTTTTAT 


AATGAAATAA 


TGTAAAGAAT 


4800 


30 


TTTCTATTCA 


ATACTTTATC 


ATGTTTAAAT 


TGTGTCACTA 


TAACATTTTC 


ATAAACATTA 


4860 




TACATGACCA 


CTATGTATTT 


TGTAAGTATC 


CGCAATTiVAT 


TCTTTACAAC 


ATACATAAAT 


4920 




GTTTCTGACG 


TTATTATCAT 


TTATGATATG 


ATTATTTTTG 


CTAAAGACAA 


TGAAATITrA 


4930 


35 


•TGAAAGGATT 


TACACAAATG 


GCGAATATCG 


TTTTTAAATT 


GTCGGATAAA 


GACATAACGA 


5040 




CATTAATGTC 


ACGCATTTCT 


TTTGATACTG 


AGAATTTACC 


TCAAGGnATG 


AnAGCACGTG 


5100 




CAAAGTATCC 


AAAATACAAC 


TGTAAATATT 


TACCAT 






5136 



40 

(2) INFORMATION FOR SEQ ID NO: 333: 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4239 base pairs 
(B> TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



so (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 333: 

GGCCAAAATT GCACCTCCAC TTTCCTTTGA ACAAATCTAT TTTAAACGCA CATTCCCATT 60 
ATGACAAATT AAATGTGAGT nACATTTGTT TGTATTTTAA CATGACTACT AACGCAAACT 120 

.55 
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GGTATCTTTC AAAGATAAAA TCTTAATAAT 
CACAATATTA TATAGACCTA TTTTATTTTG 
5 ACCTTTATAA AAATTCATAC CTTTATGCTA 

AATTCTTAAC TATCCTTTGA TGATTGTTTT 
CGAATTTCTA TAGTTCAATG CTACTAAAAA 

10 

TGTTTTATAA TTATGCTTGC GATGGTGTTT 
ATTTAAACTC TTTACCATCA TGATCTACTG 
CTAATATTAA TTCACTTAAA TTATCTTCGA 

15 

TTGCACCATA TTCTGGATCA TATCCTTCTT 
CAATAATATT TATGTTTTGT TCAGATAATC 
20 CAATTTCTTT TAATTCTTCT TTTGTTAGTT 

TTAAAAATTC TGGACGGAAT GAATTTTTTA 
CATAATCTTG TCCATCACTT GAACCACCGA 
GTGCCCCAAC GTTTGATGTC ATTATGATAA 
TTGTATCTGT CAAATGTCCA TCATCTAAAA 
GAGCTTTTTC AATTTCATCA AATAAAATTA 

30 

TTAATTGTCC ACCATCATCA TGACCAACAT 
CTGCGTGTTT TTCCATAAAT TCACTCATGT 
3^ ACATTGATTC AGCTAAAGCT CTAGCTAATT 

AGATAAAGCT ACCAATTGGT CGTTTAGGAT 
■ CTTTACTGAT TGAATTAACA GCATCTTTTT 
CTAGACTAAG AAGTTTTTCA GATTCTGTTT 
ATCCTGCAAT AACTTCAGCA ATATCTTCTT 
CATTCTTCCA TTCATTTTTA GCTTCTTCAT 

45 

GCAGgTTAGC AGCATTTTCA AACTCTTGAG 
CTTTTTCAAT TTCTTGTTCA ATTTCTTTTA 
TTACTTTAGA ACTTGCTTCA TCAATTAAAT 

SO 

AAACGTATCT GTTACTTAAT TTAACAGCTG 
GATGGTGTGC TTCGTAACGA TCTCTTAATC 

55 



TTCTTAGTAA ACTCTTTTCT CTAGATTTAT 240 

ACGTAAGTTG CTAGTATCTT CAAACAAAAA 300 

TCGCTGTAGG CTCATTAACT TGTTACATAT 360 

ATTAGATTGT TTCGTTGATG GATACTTTCA 420 

AACAGCCCAA AACTTTAATT TGTTTTGGAC 480 

TAGTTTCTGA AGTTTGTTCA GCAATGTCAT 540 

TAACTTTCTT ACCTTCAATT TGATTACCAT 600 

TAGTTTTTTG TATCGCXCTA ATTAATGGTC 660 

CTGCGATTTT GTCTTTCGCT TTATCAGTTA 720 

GATTTGTTAA TTTATTAACC ATCATTGTTA 780 

TATGGAATAC AATGATATCA TCTACACGGT B40 

ATTCTTTTAA CATCGTTTTT CGAATTGTTT 900 

ATCCAGCAAA TCGTTGATCT TGTAATTCTT 960 

TTGTATTTCT GAAATCAACT GTACGTCCTT 1020 

CTTGTAATAG AATATTAAAT ACATCTGGAT 1080 

CAGAATATGG TTTACGTCTA ACTTTTTCAG 1140 

ATCCTGGAGG AGCACCAACT AATCGGCTCA 1200 

CTACACGGAT CATCGCATCA TCATCGCCAA 1260 

CAGTTTTACC AACACCAGTT GGTCCAAGGA 1320 

CTTTTAACCC TGCACGGGCA CGTCTAACCG 1380 

GCCCAATAAC TCTCTCATGT AATGTATCTT 1440 

CATTGATTTT AGTTAATGGG ATACCTGTCC 1500 

CTGACAATGA AGTTGaCATG CCATTTTGTG 1560 

ATTGCTTTTC AAGTnTGTT TGTTTATCAC 1620 

CATGTACTGC GGCATCTTTT TCATTTTTAA 1630 

AATTATTAGG TGTCGTATGA CTCTTAAGTC 1740 

CAATTGCTTT ATCTGGTAAG AAACGATCTG 1800 

CTTCAATAGC TTCGTCTGAA ATATTAATAC 1860 

CTTTTAAAAT AGCAACTGTA TCTACTACTG 1920 
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TTTTGCGATA 


TTCATCTAAT 


GTAGTAGCAC 


CAATACATTG 


TAATTCACCA 


CGTGCTAATG 


2040 




CCGGCTTCAA 


AATATTCGAA 


GCATCGATAG 


CACCTTCAGC 


ACCACCAGCA 


CCAACTAAAG 


2100 


5 


TATGCAACTC 


ATCAATAAAT 


AGGATGACAT 


TACCTGCTTG 


TTGGATTTCT 


TCCATAACCT 


2160 




TTTTCAGACG 


CTCTTCAAAT 


TCACCACGAT 


ATTTAGTACC 


TGCAACTACT 


GTTCCCATAT 


2220 


10 

1 V 


CTAAAGACAT 


AACACGCTTA 


TCTTTTAATG 


TCTCTGGTAC 


CTCATTATTC 


ACTAtGGCtT 


2280 


GCGCTAAACC 


TTCAGCAATA 


GCAGTTTTAC 


CAACACCTGG 


CTCTCCAATA 


AGCACAGGAT 


2340 




TGTTTTTCGT 


ACGTCTACTT 


AATACTTCAA 


TTACACGTGT 


AATTTCTTTA 


TCACGTCCTA 


2400 


15 


TAACAGGATC 


TAATGTACCG 


TCTTTGGCAA 


TGACTGTTAA 


GTCACGAGCT 


AAACTATCTA 


2460 




AAGTTGGAGT 


ATTATTTGAC 


TTACTAGCTT 


GTGCATTTTT 


ATTACTCATT 


TCAGGGTTTC 


2520 




CTAAAGCTTT 


CACAACTTGT 


GCACGTGCTT 


TAGTAATATT 


TAAATCTAGA 


TTTGCAAAAA 


2580 


20 


CTCTTGCTGC 


AACACCTTCA 


TTTTCACGAA 


TCAAGCCTAA 


TAAAATATGT 


TCCGTTCCAA 


2640 




CAAAATTGTG 


ATGTAATTTT 


CTAGCTTCAT 


CCATCGATAA 


TTCAATGACT 


TTTTTAGCTC 


2700 




TAGGTGTATA 


ATGCAATGTA 


CCAACATGAT 


CTTGACCATG 


TCCGATTAAT 


TTTTCAACTT 


2760 


25 


CTTCAATTAC 


TTTATCTTCA 


GTGATATTAA 


AACTTTCTAA 


TACTTTTGCA 


GCAATTCCTT 


2820 




CAGGTTCTTT 


CATTAACCCC 


AATAATAGGT 


GTTCTGTTCC 


TATATTTGAA 


TGATTTAAAC 


2880 


30 


GAATTGCTTC 


TTCTTGGGCA 


TGTGCTAATA 


CGCGCTGTGC 


ACGCTCAGTT 


AATCTACCAA 


2940 


ATAACATAAA 


TAATGACCTC 


CTACTTTATA 


TGTTCTCTTA 


GTATATCTGC 


TCGTTTTTCT 


3000 




TTTACAGATT 


TGTCATCTTC 


TTCATCTAAT 


AAAAATGGTG 


ACTGTATAGC 


TACCATCAAT 


3060 


35 — 


TCATTAAATT 


TAAAGTTTTG 


TAATTCAATG 


TAATTTAAAT 


CTATACCAAG 


TTTAACTcGC 


3120 




TTAATCTATA 


AGAAGCCTCT 


TCCATAGTTA 


TCATTCTACA 


GTTTTGTAAA 


ATACCTAGCG 


3180 




AGCGAAAAAC 


ACGGTCTTGT 


GTTTCTAATT 


GATTATAAGT 


GTCTAACTTT 


TGTCGTA'riT 


3240 


40 


GXTTTTCTTC 


ATGAATGATT 


TGATTAACAA 


CTTCTGTTAA 


TGTTTCTATG 


ATTTCTAACT 


3300 




CAGATTTACC 


AAGTGTAAGT 


TGGTTGGATA 


CTTGATAAGT 


ATGTCCATAA 


ACTTGCGAAC 


3360 




CTTCACCGTA AATACCTCTG 


ATTGTATATC 


CAAAACGATT 


AATGGTTTGA 


GCAATCCGTG 


3420 


45 


TCATTCTTTT 


CATAATAGAT 


AGACCTGGCA 


AATGTAGCAT 


CACGCTTGCT 


CTCATACCAG 


3480 




TACCTATATT 


GGTAGGACAT 


GTAGTTAAAT 


AACCAAGTTG 


TTCATCATAA 


CTTATATCAA 


3540 


SO 


GGCTTCGATC 


TAATTCATCA 


TCAATTGATG 


AAGCTTGATT 


ATATAAAGCC 


TGTAATGTCG 


3600 




TGTCAGTTCC 


CATAGCTTGA 


ATACGAATAT 


GGTCCTCTTC 


ATTTATCATG 


ACACTTAAAG 


3660 




ATTCATCGTC 


ATTCACTAAT 


ACTGCGGCTG 


CTGGTTGTTT 


TATTAGTTCA 


GGACTAATCA 


3720 



55 



1205 



10 



IS 



45 



SO 



EP 0 786 519 A2 

CAAAGTTTGG CAAGGCATCT TGTACCTCAT TTATAACTCT AAATCCcATC ATTTTCAGTA 3840 

GCATACATTA GTGGATGCAC ATGATTTTCT AAAtTACGCG CTAACCGAAT TCTAGAAGAC 3 900 

ATAACAATTG GTGTTTCTTC ATTACTTTTC ATCCATTGGC TGATATTATC ATGAATATTA 3960 

TGCGTCATCA TGTTGCACCT CACTCTCAGC TTTTAGTGCT TTAATTTCAT CTCTAACAAT 4 020 

GGCTGCTTCC TCAAAATCTT GGATTTCAAT AAGTTTTTTC AAATATTCAT TCTTTTCTTC 4080 

GATTTTTCGC TTTAAAGCTA TCTTTTTATG TGAAGAATGT GGTGTCTTTC CAACGTGCTC 4140 

AAATTGTCCA CCTTGAACTC TGCGGACGAT ATCAATGATG TCATCTTTAA ATGTTGcATA 4200 

ACAATTAGCA CACCCAAATT TACCAACATG TGCAATATC 4239 
(2) INFORMATION FOR SEQ ID NO: 334: 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1245 base pairs 
20 (B) TYPE: nucleic acid 

(C) STRAIODEDNESS : doilble 

(D) TOPOLOGY: linear 



25 

• (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 334: 

CAAAACTTTG ATTATGTCGT GTCAGTTATT AATGCATACA GTAATGCATC GTTGTTATTT 60 

TTTATTTATT TACTATTTAT TATGTACCAA ATCAGCCTTt CAGTAAAATA GGTCAAATTA 120 

30 

CTGATTTTCT AAATATAAAA TGCCTCCTAA TAACATACTA TTAGTACATC ATTAAGAGGC ISO 

TCTTGTGTTA TTTGCATACT AAGCGCTCAA ATTTAAATTT AAGATGAAGA TTCTTGCAAT 240 

35 AATATTTCTA TATTTGTCGA TATATCCAAT GGATCTTCCA TTGGCAAGAA TCGATTTACA 300 

ACATTTCCTT GTCGATCGAT TATAAATTTT GTGAAATTCC ATTTTATTGG GGaCCCAAAG 360 

ATTCCTGGTT GTTCaTTCTT TAAATGCGtA AATAACGGAT GTTCATCGTT CCCGTTCACA 420 

GATATTTTAG CTAACACTGG AAATGTTACA CCAAATTTCT CACGACTAAT TTTCAAGATT 480 

TCTTCATTAG AACCTGGTTG TCGATTGTCA AAATTATTAT TCGGAAAACT CAACACTACA 540 

AACCCACGAT CCTTATATTT TTGAAATAAA GTCTCTAGTT TTTTCAATTG TTCGCTATAT 600 

ATACATTCTG TTGCAGTATT AACAACTAAA ATCACTTTAC CTCTAAATGC TTCTAATTTA 660 

TAAGTTAAGC CTTTATAATC ACTTACTTCG ATATCATACA CATTTCTATT ATTCATAAGA 720 

CACCCCTACA CAGCCTTTTT TATATTGAAT ATGTTCTTTT TAGAATGTTC TGATAAAATA 780 

AGTGCGCGTT TACACCGTGA ACACACATTA TATAGCGTGA TACATTTTTC GAGCACACGA 840 

TAAATAATGT TCGAGTTTAT GTTGTTGCTC AACCTATCCG ATTTACCGTC TTTTTTCACC 900 
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10 



15 



CCGTTATAAC CCCTCATTAT AATCATCCTT ATTTTCTATT TTTAAAAAGA CAATTAGACC 1020 

GCTCTTTAAA CTATAGaTTA ATACTTAAGk TAAACTCATA CATACTGATA CCATACGTXA 1080 

GATCTAACAA TTTAAAATTC GTTATAACTA TGGATTAAAG AGCTGCCCAA CTCATATAAT 1140 

CCTTAAAAAC TTCACATGTG ATTGTkTATT AAGCCCTCCT TTATCnTATT AAATATCCTT 1200 

ATAACCCTTT TAAAATTAAA CTGACACACT CATACATTGT TACAC 1245 
<2) INFORMATION FOR SEQ ID NO: 335; 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1399 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



20 (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 335: 

CTTGTAAAGG TAGTTGTTCA TTTAAATTAA AACAGTATGC TAAGTTnGTG CTTATATTTT 60 

GCAACTTCAA TTCGACAGGC TCATCTTGAT ACATGAATGC CTCAATTTCA TCATGTGATA 120 

25 

ACTTTTTCAA AATATCAATT AAATGrATAC TAAAAACGAT AAATAACATA TCCCAATTTG 180 

AATTCAGCCC TAGCGATTTT AATTTGTTTA AAATCTTATC TTTTTGAAAA ATTCGATTCC 240 

TAATGTCTTG TATATCGTTA TCAGTCAAAG TTTCCCAATC TATATGTGAA TGAAGACCTA 300 

30 

AATAACACTT ATCCATTAAT AATTCATATA CCGTTAATGC AGAGACATCG AAACAACGTT 360 

CTTCACTTAr AAAAACGCCA TCAACATCAA ATAAAATTTT CTTCACAATC CCCACTCCAT 420 

35 TTCTGaAAAT TCAGaTATAA ATCATTCTAC TATTTGACTA AAAAAAGCGC AAACCCTATT 480 

GAAGTaGATT TGCGCTTTAG CTGTTnAAAT TTTATAAATG TnTTTCAATT TCATCAGCAA 540 

CCTGCTGTAC GTGTGTACCG ACAATAACTT GAGTTGAATG TTTGCCATTA ACAGTAACAC 600 

CAACTGCACC GGCGTTTTTA ATCTTCTGTT TATCAATAAT AGATGTGTCT TTTAACTCTA 660 

GACGCAACCT TGTTGCACAA TTGGTTAAAT TAACAATATT CTCTTGACCG CCTAAACCTT 720 

CTAATATTTG TATAGCATGT TGATGATATT TACTTTGTTT AATATCATTT TCACCAGGAG 780 

45 

CAATATTATC TTTTACAACT GTTGGGTCAA CTAATTCATT TTCACCTCTA CCAATCGTAT 840 

TCAAGTTAAA TACTTGGATT ACTACACGGA AAATCACATA GTATAAGATG AAAAATACAA SCO 

CACCTTGAAC AAGCAACATC AATGGATGAT TTGATACTGG ATTAATTAGT GATAACACAT 950 

SO 

AATCTATCAA ACCTGCACTA AATGAAAATC CAGCTGTCCA ATGGAATGTA GCTGCGATAA 1020 

ATAAAGATAA TCCTGTTAAT AACGCATGAA CAACATATAA GATTGGCACA ACAAACATAA 1080 
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ACCAACCGTA AACTTGTTTT TTCTGAGTAG TTTTAGCTGT ATGATACATT 



GcTAACGCAG 



1200 



CCGCTGGAAT ACCGAACATC ATGATTGGGA AGAATCCCGC TTGATAGCGT 



CCTGTAATAC 



1260 



CTTTTATAGC ATCTTTGCCA CTTTGGAATT TACCAATATC ATTAATACCA 



ATCGTATCAA 



1320 



ACCAGAACAC ACTATTCAGT GCATGATGTA ATCCTGTAGG AATTAATAAT 



CTATTGGCAA 



1380 



CACCATATAT GAAAGCTCC 



1399 



10 



15 



20 



25 



30 



35 



40 



45 



SO 



(2) INFORMATION FOR SEQ ID NO: 336: 

(i) SEQUENCE CHARACTERISTICS: 

{A} LENGTH: 1329 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 336: 

TATAGTTnTA TTATTTAGCG AAGCATTAAT ACTACCACCG GTTATAACAA ATGTATTTTG 60 

CGTATTAAAT TGAATGGTAG GACCAATCAA AGTATATTCA ATCGCTGGAC CATCATTGTT 120 

AATTAATGAC TGCGCAACCT TAAAACTAAA TTGATCCATG GCACCTGCGC CTGAAAATCC 180 

AATATGTTCA TAACCTATTC TTCCTAGATC TTGTACCGTT GAAAAGAGAC CTGGTTGTAA 24 0 

AATCTTAATT GACATTTTCA ATCACCACCC AGTCATCAAC ATTAAAGTTG CCATCTGATA 300 

TATCTCTTTC GATTTGTATA AATTTCTGTT CATCTATTGC ATAAAATTGT ATCCATTCTC 360 

CTGCTTCGTA CATTGACATT GGTTCACGCT CGCTGCTAAA TACTTTTAAc GGTGTGCGTC 420 

CAATAATTTG CCATCCGCCA GGAGAATCTG ATGGATATAG TCCTGTTTGA TTATTCGCAA 480 

TACCTACAGA ACCTGCATGA ATTTTTAACC TTGGCTGATT ACGTCTAGGT GTATGTAGTT 540 

GTTCATCAAG TcCGCCTAAG TATGGAAATC CTGGCATAAA TCCTAGCATA TATATTAAAT 600 

AAGGTTTACT TGTATGTTTT TCAATAACTT GCTCAACAGT TATTCGATTA TGCTTTGCTA 660 

CTTCTTCAAT ATCTGGTCCA TATGTACCAC CATATTGAAC AGGTATTTTA ATAATACGAT 720 

TGGTTTGATT CACAGCATGA ACATTTTTTT CATTAAATTT GTTAAGTTCT AAATTTTCAA 780 

TTAATTTAGA AGATGTTATA GCTTGTTCAT CAAAATATAT TAGAACTGCT CGATACGAAG 840 

GGACAATATC TTGAATTTCT AATATTTCTT TTTCTCGTAT CCACCGTACC ATTGCTGTGA 900 

CATTACGATA TGTCTCTTCG GATATTTTAT TTTCAAAATA AATCATAATT GTCTGCTCGT 960 

TAATAAATCT TACATCCACT TTAAATCCCC CTTTGTATTG CAATAAACCA GTATTGAATA 1020 

CCTTTTCATT GTATCATTGA GAAGCACAAG TTGTTTAATA AGTAATTCAA ATCGCATATA 1080 
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TTAATATTGT AACTCTTACA CTAATTTAGG TTCTGCTATC ATTCGGTCTG ATGGAAAATT 1200 

TTTACTTTTC ATCTGTCCGA TTTTTTGATT TTGAATATAA AAAAGCACGA CCGAAGTATC 1260 

5 ATTAACACAC TTCAATCGCG CAATTAAATA ATCTATTTGA TCATTTATTG GATATTAACA 1320 

ATTTTTACG 1329 



(2) INFORMATION FOR SEQ ID NO: 337: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3421 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

15 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 337: 

2Q GAATAGTGCC ATTTGGAAAG ACATAAAGAA TCCAGAAGCA CCTTTAGCGA ATATGCCGTG 60 

TTCATATAGA TTTGTGAAAC TGGCATGCCC GAATTGAGTT TTAAATGCAA ATAGAATCAT 120 

GACGAAACCA ACTACTATTA AACCAATAAT TGTCGCTATT TTAATGATAG AGAACCAAAA 180 

2S TTCTAATTCT CCGAAAAGTC TTGCGCTAAG TAGGTTGAAT GACATTAATA ACAGTACACA 240 

AAATAGTGCA CTTATCCAGT TTGGAATTTC TGGGAACCAA AAGCTAACAT ATTTTGCCAC 300 

AGCCGTTACT TCAGCCATAC CTGTAATAAT CCAACAGAAC CAGTATGTCC ATCCGGTAAC 360 

30 

AAATCCTGCA AAAGGCCCAA TATATGTATT GGTTACATCT GCGAAAGATT TAAATTCAGT 420 

ATTCTGTATA ATGATTTCTC CTAAACCTCG CATAAACATA AATAACATAA ATCCTATAAT 480 

GATGTATGTT AATAGAATTG AAGGGCCGGT TAATGCAATC GTTTGACCAG CACCTAAGAA 540 

35 

TAAGCCTGTA CCAATTGCAC CGCCAATTGC AATTAATTGT ATGTGGCGAT TGCTCAGTTC 600 

CCTTTGTAAT TTTTCAGCCA TAATACATCT CCCTTAAATA TAGATATGTT TATTATGCAC 660 

40 TTATATTGAG ATATATACAA TTATTTTCGG TAAAAATGTG TAAAATTCCA TGTTAATATA 720 

CTTTGGTTTT TATAATCATA TATAATAACC AATTGAAAAT TTAATTCTAT TGTAAAATTC 780 

ATGGATTATT CACATCTTGA AAAAGCTTTA ATGGTGCTAT TTGTGGCTAT TCTGTGACAT 840 

TTACATAGAT TTACAAAAAA ATTGTTGCAC ATATAATGCC AGTtTTTATA TTTCACAAAC 900 

GAAATGCGTT TAcTATAATA TTAGTTGAAA GCCATTTCAT AAAGAAACAG TAAAGGGGAA 960 

ATTtATCaTA GCmGaATTAC AAAGAGGTTT AGAAGGGGTT ATCGCmGCGG AGACTAAAAT 1020 

50 

AAGTTCAATT ATTGAAAGTC AATTGACTTA TGCCGGCTAT GATATTGATG ATCTAGCTGA 1030 

AAATGCGCAA TTTGAAGAAG TTATTTTCCT ATTATGGAAC TATAGATTGC CAAACGAAGA 1140 

55 
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TACACATTTT GAGGAGTATG TTACAGATCA 
ATTATCATAT ATTGCACATT TCGATCCTGA 
5 TGAAAGAGCA ATGCGTATAC AGGCTAAAGT 

AAGACAAGAT AAAGAACCAC TTAAGCCTAA 
ATATATGTTA CGTGGGGAAT TACCAACAGA 

10 

TATTTTACAC GCTGATCATG AGTTGAACGC 
ATCATTGTCA GATATGTACT CAGGTATTGT 
CATGGTGGTG CAAACGAACA AGTTATGACG 

IS 

GTTGATGCTT ACTTAGATGA AAAATTTGCT 
CGTGTATATA AAGATGGTGm tCCTAGaGCG 

20 mCGAAAGACG CTGGTCGTGA AGAATTATTT 

GCAGAAGAAA AAGGATTAAT TCCTAATGTT 
ATGGAAATAC CTCATGACTT ATTCACGCCA 

25 ATTG.CTCATA TTTTAGAACA ATATAAAGAT 

ATTGGCGAAA CGAATCGTAA GTATATCCCG 
AAAAATGAAG ATGTAAAATT TGGAGGTAAA 

30 

GGAACTGAAG GATTAAACGT ACCTAATGAA 
ATTGGACCGG ATATTTGGAA GGCAGCAAGC 
TATAATGGCG AAAAACGCaT TGAATGGAAA 

35 

ACAACTGGTG AATGGTTACC TCAAGAAACA 
GTTAAAGGAC CTTTAACAAC ACCAATTGGT 
40 CGCCAAGAAT TAGATTTATT TACTTGCTTA 

TCACCTGTTA AACGTCCACA AGATGTTGAT 
ATTTATGCTG GTATTGAATT TAAAGAAGGT 
TTACAAAACG AAATGGGTGC GACAAACATT 
AAACCAGTTT CTAAAGAAGG AACTGAGCGA 
GATAATAACC GTAAATCAGT TACTTTAGTT 

SO 

GGCTCATTTA AGCAGTGGGG TTACGATTTA 
ACTTGGCAAC AATATGACGA AATTGTTGAA 
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CGTGCATCCA ATGACAGCAT TACGTACGTC 1260 

TGCTGAAAAT GAATCAGATG AAAATCGTTA 1320 

AGCATCATTA GTTACAGCGT TTGCTCGAGT 1380 

TCCTGACTTA AGTTATGCGG CAAACTTCC7 1440 

TATAGAAGTA GAAGCCTTCA ATAAAGCACT 1500 

ATCTGCATTT ACGGCACGTT GTGCGGTATC 1560 

AGCAGCCGTA GCTCTCTGAA AGGGCCATTA 1620 

ATGTTATCTG aGATTGGGTC AaTTGAAAAT 1680 

AATAAAGrTA AAGTAATGGG cTTCGGTCAT 1740 

AAaTATTTaA GaGAAaTGAG CCGTCAAaTT 1800 

GAAaTGTCAG TGAAAaTGGA AAAcnCGTATG 1860 

GATTTTTATA GTGCGAGTGT TTATCACTGT 1920 

ATCTTTGCTG TAAGTCGTTC TGCAGGATGG 1980 

AATAGAATTA TGCGTCCTAG AGCGAAATAT 2 040 

CTTGrAGaAA GAAAmTAATC AATACAAATT 2100 

ATAACTATGA CTGCAGAAAA AATTACTCAA 2160 

CCAATTATCC CATTTATTAT CGGTGATGGA 2220 

CGAGTTATAG ATGCTGCtGT TGAGAAAsCC 2280 

GAAGTGCTAG CTGGCCAAAA AGCATTTGAT 2340 

CTTGATACAA TTAAAGAATA TTTAATTGCT 2400 

GGTGGTATTA GATCATTAAA TGTGGCTTTA 2460 

AGACCGGTAC GTTGGTTTAA AGGAGTACCA 2520 

ATGGTTATTT TCCGTGAAAA TACTGAAGAC 2530 

ACAACAGAAG TTAAAAAGGT AATTGACTTC 2640 

CGATTCCCAG AAACTTCAGG TATTGGTATT 2700 

TTAGTTAGAG CAGCTATACA ATATGCTATC 2760 

CATAAAGGTA ATATTATGAA ATTTACAGAA 2320 

GCATTATCTG AATTTGGTGA TCAAGTATTC -2880 

AATGAAGGCA GAGATGCTGC TAATGCTGCT 2940 
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TTACAACAAA TTTTAACTCG TCCAGCTGAG CATGATGTTG TAGCAACTAT GAACTTGAAT 3060 

GGTGACTATA TTTCAGATGC TTTAGCTGCA CAAGTTGGTG GTATTGGTAT TGCGCCAGGT 3120 

GCAAACATTA ATTATGAAAC AGGTCATGCT ATTTTTGAAG CAACACATGG TACAGCTCCA 3180 

AAATATGCAG GTTTAAATAA AGTGAATCCA TCTTCAGTAA TTTTAAGTTC TGTATTAATG 3240 

TTAGAACATT TAGGATGGCA AGAAGCGGCA GATAAGATTA CAGATTCAAT TGAAGATACA 3300 

ATTGCTTCAA AAGTTGTTAC TTATGACTTT GCCCGTTTAA TGGaTGGtGC TGAAGAAGTT 3360 

TCTACATCAG CATTTGCAGA TGAATTGATT GnAAATTTAA AATAAGCAGA ATAGAATTAG 3420 



(2) INFORMATION FOR SEQ ID NO: 338: 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3173 base pairs 
20 (B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



3421 



. (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 338: 

CCCTnGATAC CCAAACTGCC CTAATACCAC TGGCTAAACC TAATGGATAG TACCATTTAT 60 

TTTCCAATAA ATAAnCCAAC TGCAATnGCT ATaACTCTAA ATATAATAGA GATAATCTOCA 120 

TTAATTGGAT TAAtACGCCA AATACTAGTA ATAATAGGCT AGATAATAAT CCACCTAAAA 180 

AGTACTTTTT AATTCCAAAG AAAGCTAATA TCAATAATGC TGCCGGTGCA GATAATTGAA 240 

AATCTAATCC TGGTATAATG GACGGTATTT TCAAAACTGC CAAAATGGTT AAAATCGCAG 300 

CAATGACACT AATTTGAGTA ATATCTTTTG ATGTCATACT AAAACCCCTA TACCGTTTCA 360 

TAAACAACTT GCTTCGGTGT GCTTTCTAAA AATGATATGT AATGATTTAA ATCAATACAA 420 

40 TCGTCCACAA ATATTATTCT GCCTCCATAT CTCGTATTAA CTGGTTTAAT ATCAAATAAT 480 

CGATGGTAAC CAATTTTAGC AGCGGCAAAA TAACCTGTCG TATACGTTAA GTCATCGGAC 540 

ACGCAAAGTT CTCCTTTGAC ATACGGATGC GCATTGATAC AACTAGCAAT TGCTAAGGCA 600 

TCAGTCACTC TTTCATTAAG ATCACCTTTA TTATTTATAT CTTCAAACGA AAAATGTGTT 660 

GCCCTAATCC CCCTTTGTCC AAATGAATCT AAACGTTTAC CAGATATAGC AGATAGAATA 720 

ATAGCTCCTG TATAAACCGT TTCATTTTTA ATATATGTCA TCCCTTGATT TAGCGCTTGT 730 

TCAGTGACAC CACATTCTTG TGTTAAATGT TGGAGATTTG CTTTATCATC CTCAATAATT 840 

TGTAATGCTT TTATTTGTTG AATCGGTTCC ATGATTTTTT GTATTTTTAT ATTGAGAAAA 900 
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ATTTTGTCAA ACTCACAAAT CGTTTCAGCA CCACTAATAT GAACATCTTG ATTGCTAGAA 1020 

CGCATTTTTA TACTATACAT GACGATCACC TcAATCTTCT TGaTGCAAAA TTTCAAACAA 1080 

5 CCTATCTATA TCTTGTTCAG TATGAAAATA CGACAATGAT ATTCTTAACA TTGGCTTAGT 1140 

CACAGTtGGA TACCTTAAAT AACTTGTAAA CACATGATGC TTTAATAATG TTTGATGAAT 1200 

GTTCTCAGCC GCTTCTATGT CATCAAACTC AATAAACTTA ATCGGCGAGT TTGaACTATT 1260 

10 

ATAATkAACA TTGAGTGCTT TTAACTTTTG GTTAAAATAT TTACTCAAAC TATTTAATTT 1320 

AGTGCGTCTA TCATCAGCAT TTATTAACTT TTCAATGTTT CTTTTTATAA AATACAAATT 1380 

ATAAATTGGC AAACTACTTG AGTAGATGAG TGGTCTACCG TGATTAATTA aCATATCCtT 1440 

15 

CaCATCaTTT GaACTkaAAA TcACACCCCC GTATGCACCA CATGCTTTAG ATAAACTAGA 1500 

AGTGAGTATA TCTACACCTT GATAATTCGA GTAAtTCTCT ATCCCAAAAC TATGTGAAAC 1560 

20 ATCGAGTATC AGTGTTGCGT TAnATTTATG CTTTAATGAG ACTAATTGAC CAATATCCAC 1620 

AACGTCGCCA TTCGTTGAAA ATACACTATC AGATATGATT ATTTTTGGTA TATTTTGATT 1680 

AGGGTATTTC TCTAACCTTT TTTCTAAATC AGCAATATCT AAATGCTTAT ATATCACTTT 1740 

25 TTCTAAACCA CTTAACTTAA TACCX5TCAAT AATACTCGCA TGATTTTCTT GATCTGAAAA 1800 

CACGACACAA TTTGTATTTT TGAAAATATT AAATAACGCC AAATTAGCAT CATAACCACT 1960 

ATTTAAGATA GTACATGcAC TATATCCGAG CCAACCTGCT AACATTGTTT CAATTTCTTC 1920 

30 

ATAAGCTGTC GAACTTCCAC TAATTAATCT TGAACTTGAT AAGTGATAAC TATACTICCG 1980 

CATAAATCTT TCGAAATCAT CCTTATCAAA CGCTATTTGA CCTAATCCTA AATAATCATT 2040 

AGATGTATAG TTCGTACATC TCTTATTTTC TACTTCAATA TACTGTCTAT CTATATACCC 2100 

35 

TACCGATTTA AGCGACCGAT ATAACCCTTT CTGTTGTAAT AAATCAATTT GCTCTTGAAA 2160 

CTTCATTCTT GTTTTCCTTA TTTTCACAAG TGTCATAATC AATTTCAAAG CCTAAATCAT 2220 

TAATCATATC GTAGTCTAAT TGGTTCGGXT GCCCACCAGT AATTAGATAA TnCACCGACA 2280 

AATATTGAAT TCGCCGCTTT TAATGCTAAT GGCTGTAACG AACGTAAGTT GACCTCTCTT 2340 

CCTCCAGCAA TACGAATTTC TTTCGTAGGA TTGATTAATC GGAATAATGC TACGATTCTT 2400 

AAACATTTCA TTGGTGTTAA ATCATCCATG CTTCCAAACT TTGTGCCTTT GATTGGATGC 2460 

AAAAAATTAA TCGGAATACT GTCGGCATCC ATTTCTTTTA AAGCAAATGC CATATCAACA 2520 

ATATCTTGAT TAGATTCTCC CATACCACAA ATCACGCCAG AACATGGTGA TATATTATTC 2580 

50 

GCTTTCATTA GTTCTATCGT ATCTGTTCTA TCTTTATAAC TATGCGTTGT CACGACGTTA 26 40 

TCATGGTAAT TTTCACTTGT ATTAATATTG TGGTTATATC TGTCTACACC AGCTGACTTA 2700 
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TGTTGAGATT TAATCGTTCT TACAGTATTA CTAATATGAT CAACTTCTTT ATCGCTCGGT 2820 

CCTCTACCAC TCATAACAAT ACAATATGTT CCAATATGAT TATCATGTGC CACCTTTGCT 2880 

5 

CCATCGATAA TTTGTTCCTC TGGAATTAAA GCATATCGCT GTTTTTGTTT AATATCTCGT 2940 

GATTGTCCAC AGTACCCACA ATTTTCAGGA CATATACCAC TTTTAGCATT TAAAATCATG 3000 

TTTAATTTTA CTTTTTTACC AAAATAATGT TTTCTTAAAA TGTACGCCTC ATTTAATAAA 3060 

10 

TCTAAGG7AT CAATATTAGT ATCCTCATAA ATtTTCAATA CAGTCTCTTT TGTtAATTGT 3120 

tCCCCTTGTA ATATGCGTTT AGCCAAATTC ATATTAACAC TTCCTATCTA AAA 3173 
(2) INFORMATION FOR SEQ ID NO; 339: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1694 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 
20 (D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 339: 

CGATTATCCA TTAATACAAC CCTAAGTAAA TGTATAAAAA TTATCTTCCA CAAACTTCAA 60 

CAAAAGCCTA AATAAATTAC AGCAATTTAT CAAATATTGC TTACTTTGAT ITTATGAAAT 120 

nACTTAATTC TAACACATAC TAAATCATCA TATACTAATT CGAAATCAAA TGCATTTAGA 180 

30 

GATAATCaAA ATGCGGAAAC ATCTCCaATA ATCAATAATC TATTCCCAAT AAATATGAAT 240 

GTTCTCAACA ATACATTATT TATATCTCTT TACACTGTCA TCGACAAAAA CTAAATCTTT 300 

CACTTTCAAT TTCGAACGTG GTTCTACGAC ATTTGCTGCT ATATCATTTA ATGGGATTAA 360 

35 

AACAAATGCA CGTTCATTCA TTCTCGGATG TGGCACCGAC AGTTTTGGTA AATCTATCAT 420 

TTCTTCTCCA TACAACAAAA TATCCACATC TAAAGTTCTA GGACCCCATC GTTCCTTTCT 480 

^0 AATACGGTGT AAACATTCTT CTGTCkTCAA ACAACATTCC AACAGTTGTA ATACTGTGAG 540 

TGTTGTTTSA ATTTCAACAC ACAAATTTAA AAAGTTAGGT TGCTCAGTAT ACCCAACTGG 600 

TGCTGTTTCA TAAATCGGAG AAATAtTAGA TACGTTAATA CCATCATATT CATTCaAAAT 660 

45 

CTTyATAGCA TCGTTTAACt GGCTTTCTCT ATCACCAaTa TTACTACCTA AyCCTAAGTA 720 

TGCTTGAATC ATyTATTCTC CCTCACTATT TCGATACCTA CTCCATCATA ATGACCCGGA 780 

ATCGGTGGGT TTTCTTTAGT GATTCTCACT TTCGTTTCCA TTACACGATT ATATTGTGAA 840 

SO 

TTTATACGAT TTGCAATACG TTCAGCTAGA TGCTCAAGTA AATTAACGGC CTTACCTTCC 900 

ATAATTGATT TAACCTCTTc GAACACTTCA CCATAATGAA CTGTATCAAT AACATTATCA 960 
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ATTTCATTTT CAGCTGATAA AGCACCATGA TATCCATAAA AGCGCATACC TTTAAGAAAG 1080 

ATTGTGTCTT GCATTTTCAT TCTCCTTTAA AAAATCTATA CCTTTAGCTA ATTTAGCATT 1140 

CAACTCXjACA TTATGAACGC GTACTGCTCT AACGCCTTTC ATAATACCAT ATGCAGTCGT 1200 

AGCTGCAGTT ACTTCATCTC TTTCAACCGG TGTTGTATCA TAACCCATCA TCTCTTTAGT 1260 

GAAACGTTTC CGGCTTGTCG CTAATAAAAC TGGATATTCT GTTGCAACAA GTTCATCCAG 1320 

TCTTGCCATA ACTTCGGCTT CTTCATTTCT AGTTTTAGCG AAACCTATAC CTGGATCTAG 1380 

CCAAATTTTA TTTGAAGGTA TACCAGCTAT TTTAGCTTGA TGTGCTTGTG CTAACAAAGA 1440 

TGTTAACATT TCTTCGACAA CCGGTTCATC ACGATTACCA TTTCCATTAT GCATTAAAAT 1500 

AATTTCCGCG TCATAtTTAG CTACAATTTG GAACATACGA TGATCATACA GACCgCCcAT 1560 

tGATCATTAA TCATATCAAC GGCTAATTTT AAACATGCTT CAGCAACCTC ACTTCGAAAT 1620 

GTATCGACTG AAATTTTTTA CATCAnAACC GACAATAGCT TCAnCAACAG TAATACTCTG 1680 

TTCCATCTCT TCTG 1694 
(2) INFORMATION FOR SEQ ID NO: 340: 
25 ii) SEQtTENCE CHARACTERISTICS: 

(A) LENGTH: 1358 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

30 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 340: 

AGCATTTCTT TTCTATAAAC ATTTAATTGA ACATTATTAA GTACACTATT ACTATAGTCA 60 

CTATATTGAA CaCATACCTC ATTTAATTCT AATAGCGGTT CAGATTTGTA CTTATTATCA 120 

TTATTTGCAG ATGTTTCATC TATCCATTTT TTCACTTTAA ATTTAACATG TTCACTCATA 180 

CAAACGTCAC GTAAATTCGC TAAGTTATCA ATGGATTCGA CATCTACTTC TGCATATTTA 240 

AGCGCTGTAC AGTATAATGG TTCACGTATG CCTGCTTCTT TAAGCTTAGA TGATTTTAGC 300 

AAATCACTAG GCGTTGTATT AGCGATGATT TTTCCATCTT TAAAAAGAAG AACTCTATCA 360 

AACGTATCAT CTAATGATTC TTCTAATCGA TGTTCGACAA TAATCATCGT TGACTTTGTT 420 

TCTTCATGAA TATTGTTTAA CAATCTCAGC GTTTCATGTC CTGTCGCAGG ATCTAAATTG 480 

GCCAGTGGCT CATCCAATAT TAAAATAGGC GTACGATGGA TTAATATACC ACCTAATGAA 540 

ACGCGTTGTT TTTGACCTCC AGATAAATCT TGCGGTCGGT GATTTAAATG TTCTATCATG 600 

CCAACTTTTT CAGCCCAATA ACTTACATTT TTCTTCATAT CATCTTGTTC AACACAATTA 660 
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TCTTGTAAAA CTGTACCAAC AACATTAGAT CTATCATGTA AACAACTAAC GGTTGCATCT 780 

TGATTATTTA TATATAGTTC CCCAGTTATG TTACCTTTAG TTTTAAATGG AATTAATCCG 840 

TTTATGCAAT TTGCAAAAGT CGATTTACCA CTACCCGAAG CACCAACTAC TAATACTTTT 900 

TCTCCTGGAT AAATATCAAC ATTTATATTC TGTAATGTAG GTGTTGCTTG ACTATGATAT 960 

TGAAAACTAA AGTCTTTGAA CGAGATAATT GGTTCAGTCA TGATATATCA TTACCTTTCT 1020 

ATATTCATTT ACATATCTGA TTCAACAAAA TAACTATTCC TTACGTAAAC TACCTTTTTT 1080 

AATTTGAGAT GAaGCATATG CTTTTAATAA TATTGTCCCA ATAATGCCAA CTGAAATAAT 1140 

ATTTAATACT GCAGAGATAA CACCTTGTGT ATAAACCTTG TTAGCTGGTT CGTTATAAAT 1200 

CAAAATATCT AATGTTGGTG CAATAAGTGC CCAGCAAATA ATATTCGCAA TAATTTGACC 1260 

GATATTAAAA TAAACCATCG ATTTCCTAGA AAATCGGCCT GAAGAAAGAT TTAATTTTAG 1320 

20 TCCAATCCAG CCATATAAAC AGCCTATAAT TCCCGAGC 1358 
(2) INFORMATION FOR SEQ ID NO: 341: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4557 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

30 

(xi) SEQUENCS DESCRIPTION: SEQ ID NO: 341: 

TAGAAGAATT GGAGAAAATG CTAATTCAAT TGTCAACATT CCATAGTTAT CATGATTTAG 60 

AGTTTCTATT TGTGACACGT GAAGATGAAG TTGAAACATT GAAATGGGCA CGTTGGTTGC 120 

"CACATATGAC ATTGAGAnGG CAAAACATTA GAGGATTTGT TTACAATCAA CGAACGCGTG 180 

ACCAAATTTT AACGTCAATT TATAGCATGA TTAAAGAACG TATCCAAGCT GTGCtGaACG 240 

CAGCAGAAGT AATGAGCAAA TTATTTTCAC ACCGCAATTA GTGTTTGTCA TTACAGATAT 300 

GTCATTAATT ATTGATCATG TCATTTTAGA ATATGTAAAC CAAGATTTAT CAGAATATGG 360 

TATTTCATTA ATCTTTGTTG AAGATGtGAT TGaAAGTTTG CCAGAGCATG TAGATACCAT 420 

45 TATTGATATC AAGTCTCGTA CTGAAGGCGA ACTGATTACG AAAGAAAAAG AATTAGTTCA 480 

ATTGAAATTT ACACCTGAAA ATATTGrTAA CGTCGATAAA GAATATATCG CGCGACGTTT 540 

GGCGAATTTG ATACACGTCG AACATTTGAA AAATGCAATT CCTGATAGTA TTACATTTTT 600 

AGAGATGTAT AACGTGAAAG AAGTAGATCA GCTTGATGTG GTTAATCGAT GGAGACAAAA 660 

CGAAACATAC AAAACGATGG CAGTACCTTT AGGTGTAAGA GGTAAAGATG ATATTTTATC 720 
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AGGGAAATCT GAGATTATCC AATCATACAT TTTATCTTTA GCTATTAATT TTCACCCTCA 840 

TGAAGTTGCA TTCCTATTGA TTGACTATAA AGGTGGGGGT ATGGCGAACT TATTTAAAGA 900 

TTTAGTCCAT TTAGTTGGTA CGATTACAAA CTTAGATGGC GATGAAGCGA TGCGTGCCTT 960 

AACATCAATC AAAGCCGAAT TGAGAAAACG TCAACGTTTA TTCGGAGAGC ATGATGTTAA 1020 

CCATATTAAT CAATACCATA AGTTATTTAA AGAAGGTATT GCGACAGAAC CAATGCCACA 1080 

TTTATTCATT ATTTCCGATG AGTTTGCCGA ATTAAAATCA GAACAACCTG ATTTTATGAA 1140 

AGAACTTGTA TCAACGGCAC GTATTGGACG TTCGTTAGGT ATTCATTTAA TACTTGCGAC 1200 

ACAAAAACCA TCGGGTGTTG TTGaTGACCA AATTTGGTCT AACTCTAAAT TTAAGTTGGC 1260 

ATTAAAAGTA CAAGATAGAC AAGACAGTAA TGAAATTTTA AAAACACCAG ATGCAGCAGA 1320 

CATTACrtlTTA CCaGgTCGTG CGTATTTACA AGTTGGTAaT AATGAmATTT ATGAATTATt 1380 

20 CCAATCTGCA TGGAGTGGTG CAACATATGA CATCGAAGGC GATAAATTAG AAGTTGAAGA 1440 

TAAGACGATT TACATGATTA ATGACTATGG TCAACTTCAA GCAATCAACA AAGACTTGAG 1500 

TGGACTTGAA GATGAAGAAA CGAAAGAAAA TCAAACTGAG TTAGAAGCGG TCATAGATCA 1560 

■ 

25 TATCGAATCT ATTACAACAC GATTAGAAAT CGAAGAAGTT AAGCGTCCAT GGCTACCACC 1620 

ATTGCCAGAA AATGTATATC ArGAAGATTT AGTAGAAACa GATTTCAGAA AATTATGGTC 1680 

AGATGATGCA AAAGAAGTGG AATTAACATT AGGACTTAAA GACGTACCAG AAGAACAATA 1740 

TCAAGGACCG ATGGTATTGC AATTGAAAAA AGCTGGGCAC ATCGCGTTAA TCGGAAGTCC 1800 

AGGATATGGT AGAACAACGT TCTTACACAA CATTATTTTC GATGTTGCAA GACACCATCG 1860 

TCCTGATCAA GCACACATGT ACTTGTTCGA TTTCGGTACC AATGGTTTGA TGCCAGTTAC 1920 

AGACATACCA CATGTCGCTG ATTACTTTAC AGTAGATCAA GAAGACAAGA TTGCTAAGGC 1980 

•GATACGTATA TTTAATGATG AAATTGATCG TCGTAAGAAG ATTTTAAGTC AGTATCGTGT 2040 

CACTAGTATT TCTGAATATC GAAAATTAAC TGGTGAAACA ATTCCGCATG TCTTTATTCT 2100 

TATTGATAAC TTTGACGCAG TAAAAGATTC ACCTTTCCAA GAAGTTTTTG AAAATATGAT 2160 

GATTAAAATG ACGCGTGAAG GGCTAGCATT AGACATGCAA GTAACCTTAA CTGCTTCAAG 2220 

45 AGCTAACGCT ATGAAAACAC CAATGTACAT TAATATGAAA ACGCGTATCG CAATGTTTTT 2280 

ATATGATAAA TCAGAGGTGT CGAACGTAGT AGGACAGCAA AAATTTGCGG TTAAAGATGT 2340 

TGTGGGTCGA GCATTGTTAA GTAGTGATGA CAACGTATCA TTCCATATTG GCCAACCATT 2400 

TAAACATGAT GAGACCAAAT CATATAATGA TCAAATTAAT GATGAAGTAT CGGCGATGAC 2460 

AGAATTTTAT AAAGGTGAAc ACCAAATGAT ATtCCTATGA TGCCAGATGA AATTAAATAT 2520 
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C5GATTAGATT ATGAAGGTGT TACACTACAA AAAATTAAAT TAACTGAACC AGCAATGATT 2640 

TCATCAGAAA ATCCGAGAGA AATTGCGCAT ATTGCTGAAA TTATGATGAA AGAAATTGAC 2700 

ATATTAAATG AAAAATATGC GATTTGTATC GCAGACTCAA GTGGAGAGTT TAAAGCTTAT 2760 

AGGCATCAAG TGGCTAACTT TGCCGAAGAA AGAGAAGACA TTAAAGCGAT TCATCAACTA 2820 

ATGATTGAAG ACTTAAAGCA AAGAGAAATG GACGGCCCAT TTGAAAAAGA TTCACTTTAT 2880 

ATTATCAATG ATTTTAAAAC ATTTATTGAT TGCACGTATA TTCCGGAAGA TGATGTTAAA 2940 

AAGCTTATTA CAAAAGGACC AGAACTTGGC TTGAACATTT TATTTGTCGG CATTCATAAA 3000 

GAATTAAtAG ATGCTTATGA TAAACAGATT GATGTTGCAC GTAAAATGAT TAACCAATTT 3060 

AGTATAGGTA tTCGTATTTC AGACCAACAA TTCTTTAAAT TTAGATTTAT TCAACGAGAA 3120 

CCTGTTATTA AAGAAAATGA AGCATATATG GTCGCAAACC AAGCTTATCA AAAGATTAGA 3180 

TGGTTTAAAT AGCAATGAAT TAAATAGGAG GGAGGTATGT TATGAATTTT AATGATATTG 3240 

AAACAATGGT TAAGTCGAAA TTTAAAGATA TTAAAAAGCA TGCTGAAGAG ATTGCGCATG 3300 

AAATTGAAGT TCGTTCTGGA TATTTAAGAA AAGCTGAACA ATATAAGCGA TTAGAATTTA 3 360 

25 ATTTGAGTTT TGCACTAGAT GATATTGAAA GCACAGCAAA GGACGTACAA ACTGCAAAAT 3420 

CTAGTGCTAA TAAGGACAGT GTAACTGTTA AGGGAAAGGC GCCCAATACG TTATATATTG 3480 

AAAAAAGAAA TTTGATGAAA CAAAAGCTTG AAATGTTGGG TGAAGATATC GATAAAAATA 3S40 

AAGAATCCCT CCAAAAAGCT AAGGAAATTG CTGGCGAAAA GGCAAGTGAA TATTTTAATA 3600 

AAGCAATGAA TTAATATTGA GGTGAAGATA TGGGTGGATA TAAAGGTATT AAAGCAGATG 3660 

GTGGCAAGGT TGATCAAGCG AAACAATTAG CGGCAAAAAC AGCTAAAGAT ATTGAAGCAT 3720 

GTCAAAAGCA AACGCAACAG CTCGCTGAGT ATATCGAAGG TAGTGATTGG GAAGGACAGT 3780 

TCGCCAATAA GGTGAAAGAT GTGTTACTCA TTATGGCAAA GTTTCAAGAA GAATTAGTAC 3840 

AACCGATGGC TGACCATCAA AAAGCAATTG ATAACTTAAG TCAAAATCTA GCGAAATACG 3900 

ATACATTATC AATTAAGCAA GGGCTTGATA GGGTGAACCC ATGATGAAAG ATGTTAAGCG 3960 

AATAGATTAT TTTTCTTACG AAGAATTAAC AATTTTAGGT GGTAGTAAAT TGCCTCTCGT 4020 

45 AAATTTTGAA TTGTTTGATC CATCAAATTT TGAAGAAGCT AAAGCTGCTT TAATTGAAAA 4080 

GGAATTAGTA ACAGAGAATG ACAAGTTAAC TGATGCAGGT TTTAAAGTGG CTACATTAGT 414 0 

CAGAGAGTAT ATTAGCGCCA TTGTAAATAT TCGAATTAAT GATATGTATT TTGCACCATT 4200 

TAGCTATGAA AAAGATGAAT ATATTTTGTT AAGCCGGTTT AAAAATAATG GGTTTCAAAT 4 260 

ACGAATTATC AATAAAGACA TTGCATGGTG GTCGATTGTA CAATCATATC CTTTATTGAT 4320 
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CTTAAATAAT GAAAGTATCG ATACGATTGG GCGTGTTTTA GAAATTGAAA TATACAATCA. 4440 

TCAAGGTGAC CCTCAACAAA GTTTATATAA CATTTATGAA CAAAATGATT TGTTATTCAT 4500 

TCGATACCCA TTAAAAGATA AAGTGCTGAA TGTTCATATT GGTGTCATTA ATACATT 4557 
(2) INFORMATION FOR SEQ ID NO: 342: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3 931 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

15 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 342: 

TTGAGTGACT TTATTGAAGC GCGTGTAGAA GAAATATTCT TCGAAGTATT TGATGTTTTA 60 

^0 CAAGATTTAG GATTAACAAA AGTAAATGGT GGGTTTATTG TAACTGGTGG ATCTGCAAAC 120 

TTACTTGGCG TAAAAGAATT ATTATCAGAT ATGGTAAGTG AAAAAGTTAG AATTCACACG 180 

CCATCACAAA TGGGAATTAG AAAACCTGAA TTTTCTTCAG CAATTTCTAC AATTTCTAGT 240 

AGTATCGCTT TTGATGAGTT ATTAGATTAT GTTACAATTA ATTATCATGa TAATGAAGAA 300 

ACTGAAGAAG ATGTTATTGA TGTGAAAGAC AAAGATAACG AATCTAAATT AGGCGGaTTT 360 

GaTTGGTTTA AACGTAAAAC AAACAAAAAA GATACTCATG aAAATGAAGT AGAGTCAACA 420 

GATGAAGAAA TTTATCAATC AGAAGATAAT CATCAGGAAC ATAAACAGAA TCATGaACAT 480 

GTTCAAGACA AAGATAAAGA TAAAGAAGAA AGTAAATTCA AAAAACTAAT GAAATCTCTA 540 

TTTGAATGAT TATTGGCCAA TAAAACTAGG AGGAAATTTA AATGTTAGAA TTTGAACAAG 600 

GATTTAATCA TTTAGCGACT TTAAAGGTCA TTGGTGTAGG TGGTGGCGGT AACAACGCCG 660 

TAAACCGAAT GATTGACCAC GGAATGAATA ATGTTGAATT TATCGCTATC AACACAGACG 720 

40 GTCAAGCTTT AAACTTATCT AAAGCTGAAT CTAAAATCCA AATCGGTGAA AAATTAACAC 780 

GTGGTTTAGG AGCAGGAGCT AATCCTGAAA TCGGTAAAAA AGCTGCAGAG GAATCTCGTG 840 

AACAAATTGA AGATGCAATC CAAGGTGCAG ACATG6TATT TGTTACTTCT GGTATGGGTG 900 

GCGGAACTGG TACTGGTGCA GCACCAGTCG TTGCTAAAAT TGCAAAAGAA ATGGGCGCAT 960 

TAACTGTTGG TGTTGTAACT CGTCCATTTA GTTTTGAAGG ACGTAAACGT CAAACTCAAG 1020 

CTGCTGCTGG AGTAGAAGCT ATGAAAGCTG CAGTAGATAC ATTAATCGTT ATACCAAATG 1080 

SO 

ACCGTTTATT AGATATCGTT GACAAATCTA CGCCAATGAT GGAAGCATTT AAAGAAGCTG 114 0 

ACAACGTGTT ACGCCAAGGT GTACAAGGTA TCTCAGACTT AATCGCTGTT TCTGGTGAAG 1200 
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« 

GTATTGGTGT TTCTTCTGGT GAAAATAGAG CGGTAGAAGC TGCTAAAAAA GCAATCTCTT 1320 

CTCCATTACT TGAAACATCT ATCGTTGGTG CACAAGGTGT GCT7ATGAAT ATTACTGGTG 1380 

GCGAGTCATT GTCATTATTT GAAGCACAAG AGGCTGCTGA TATTGTCCAA GATGCTGCAG 1440 

ATGAAGACGT TAATATGATT TTCGGTACAG TTATTAATCC TGAATTACAA GATGAGATTG 1500 

TTGTAACAGT TATTGCAACT GGTTTTGATG ACAAACCAAC ATCACATGGT CGTAAATCTG 1560 

GTAGCACTGG ATTCGGAACA AGCGTAAATA CTTCTAGCAA TGCAACTTCT AAAGATGAAT 1620 

CATTCACTTC AAATTCATCA AATGCACAAG CAACTGATAG TGTAAGTGAA AGAACACATA 1680 
CAACTAAAGA AGATGATATT CCTAGCTTCA TTAGAAATAG AGAAGAAAGA CGTTCAAGAA . 1740 

GAACAAGACG TTAATCGGTT AATATATATA CACAAATAAT TCAACACAAA TCATCAGATA 1800 

ACATATCTGA TGATTTTTTT ACTAATTTTT AGaACATGTA GAAGGACATT TAAGTTTTTC 1860 

20 aAAGTTATTA AAAGTGTTTA AGTATCGTGT GAAAATTAAG TCaAAAATTA TTTGCGCAAC 1920 

ATTTTAACTT TAAACATAAA TGTTATATTA TATAATTATT AACTTTGTAC AGTTAGACGA 1980 

AGATAATTTA AATGAAATGA TGGTGACGAT CGAGTGAATG ATAATTTTAA AAAGCAACCG 2040 

25 CATCATTTAA TATATGAAGA GTTATTACAA CAAGGTATTA CTCTAGGTAT TACAACTAGA 2100 

GGAGATGGTT TAAGTGACTA TCCTAAAAAT GCTTTTAATA TGGCGAGATA TATTGATGAT 2160 

CGCCCATATA ATATTACTCA ACATCAATTG CAATTAGCTG AAGAAATTGC GTTTGATAGA 2220 

AAAAATTGGG TGTTTCCCAT TCAAACACAT GAAAATAAAG TCGCTTGTAT TACAAAGGAT 2280 

GATATAGGCA CAAATATAGA CACTTTAACT GATGCGCTTC ATGGTATTGA TGCGATGTAC 2340 

ACATATGATA GTAATGTCTT ATTAACGATG TGTTATGCAG ACTGTGTACC AGTATATTTT 2400 

TATAGTACAA AACATCATTT TATTGCATTG GCGCATGCAG GTTGGCGTGG TACCTATACT 2460 

GAAATTGTAA AAGAAGTGCT AAAACATGTG AACTTTGATT TGAAAGACTT ACATGTCGTT 2520 

ATTGGACCAT CTACATCATC AAGTTATGAA ATTAATGATG ATATTAAAAA TAAATTTGAA 2580 

ACATTGCCAA TTGATAGTGC CAACTATATT GAAACTAGAG GACGAGATCG TCATGGTATT 2640 

GATTTGAAAA AAGCCAATGC TGCATTATTA ATTTATTATG GTGTTCCTAA AGAAAATATT 2700 

45 TATACGACAG CGTATGCTAC ATCTGAACAT TTAGAATTAT TTTTCTCTTA TCGATTAGAA 2760 

AAAGGTCAAA CAGGACGCAT GTTAGCATTC ATTGGTCAAC AGTAAACAAG GAGGAGATAT 2820 

GTTTGCGTGT GAAAGATAAT TTACAACAAA TCTCAACACA AATTAATGAC AAAAGTGAAA 2880 

AAAATAATTT TTCAACAAAA CCAAACGTGA TTGCAGTTAC AAAATATGTT ACAATAGAGC 2940 

GAGCTAAAGA AGCGTATGAG GCTGGAATAA GACATTTTGG TGAGAATAGA TTGGAAGGCT 3000 
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AATCTCGAAA AGTTAAGGAC GTTATAAACG ACGTAGATTA TTTCCATGCT TTAGATCGAT 3120 

TGAGCTTAGC CAAAGAAATT AACAAACGTG CAGAACATAA AATTAAATGT TTCTTGCAAG 3180 

TGAACGTTTC GGGAGAAGCT TCTAAACATG GTATTGCTTT AGAAQATGTr GATCAGTTTA 324 0 

TAGATGATCT TAAAAAATAT GACAAAATCG AAATTGTAGG TTTAATGACG ATGGCACCAT 3300 

TGACAGATGA TGAAGCATAT ATTAGATCGT TATTTAAACA GTTACGTTTG AAAAAAGAAG 3360 

AAATACAACG ACTCAATTTA GAATATGCGC CTTGTGATGA ATTATCAATG GGAATGAGTA 3420 

ATGACTATCT TATTGCAGTT GAAGAAGGTG CGACGTTTGT TAGAATTGGG ACTAAACTTG 3480 

TAGGAGAAGA GGAGTGAGCC ACTTGGCTTT AAAAGATTTA TTTAGTGGAT TTTTTGTAAT 3540 

AGATGATGAA GAGGAAGTAG AAGTACCTGA CAAACAACAA CAGGTAAATG AAGCGCCAGC 3600 

AAAAGAGCAG TCACAACAAA CAACAAAACA AAACGCAATC AAATCAGTCC CTCAAAAATC 3660 

20 TGCATCAAGA TATACAACAA CGTCAGAAGA AAGGAATAAC CGTATGTCTA ATTATTCAAA 3720 

AAATAATTCA CGTAATGTTG TAACTATGAA CAATGCTACA CCAAACAATG CATCACAAGA 3730 

AAGTTCAAAA ATGTGTTTAT TCGAACCACG TGTTTTTTCA GATACACAAG ATATTGCTGA 3840 

25 TGAGCTTAAA AACCGCCGTG CGACACTT6T CAATTTACAA CGTaTTGATA AAGTATCAGC 3900 

GAAAAGAATT ATTGATTTTT TAAGCGGTAC T 3931 
C2) INFORMATION FOR S2Q ID NO: 343: 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH; 3150 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SBQ ID NO: 343: 

AATTGTCGGG GGACTCTTAG GTTTTGTCAT GCAAAGAACA AGATTTTGTT TAACAGGTGG 60 

CTTTCGAGAT ATGTATGTGC AAAAGAATAA TAAGATGTTC TATGCATTAT TAATCGCTAT 120 

TACTATTCAA AGTATAGGAT TATTGATTTT GACGGCAACA GATATTTTAC AAATTCCTGC 180 

45 ACATAGTTTT CCAATATTGG GAACAATTAT AGGTTCTTTT ATTTTTGGAA TTGGAATAGT 240 

ATTGGCTGGA GGATGTGCAA CAGGtACTTG GTATCGCGCT GGTGAAGGGC TAATTGGTAG 300 

TTGGATTGCA TTAGTATTAT ATGCTGTTAC TGCAGCAATC ACTAAAACAG GGATTTTAAA 360 

GCCAGTAATG GATAAAATTA ATCAACCAAC GAATGTAAAT AGTGATATGT CTCAAACAAC 420 

TGGCATTCCG TTTTGGGGAT TAGTCGTTAT ATTAACTATA ATCACCATTT TTCTAGTTGT 4 80 
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AGGTATTAGA TATTACCTTT TCGAAAAACG 
TGGACTTATC GCACTCTTAG CTTGGCCAAT 
5 AGGTATAACA ACGCCTTCAG CAAATTTAGT 

TATTGATTGG GGTGTCTTTT TAGTTCTAGG 
AGGATCAAGA GAATTTAAAT GGCGATTGCC 

10 

TGGTGGCATA TGTATGGGAT TTGGTGCGTC 
TTTGGTTGAA ACGGCAACGA TGACTTGGCA 
TTGGTGTATG GACAATGAGT CATTTTATCT 

1o 

AATCTGCAAA GGTTAAACAG CAAACGCAAA 
TGATCAAATA AAAGTGATTG GAAAAGGAGA 

20 AGGAATGGTA TGTCCATTTC CGTTAATTGA 
TGGAGATGAA TTAAAAATTG ATTTTGATTG 
GGCTGCAGAA AATGGTTATC CTGTAACAAA 

25 AATTACAATT CAAAAAGTTT AACGTTATCA 

TGGCTACTTC CGCTAATTTA AAAGTGAGTA 

CATTTTTATA TAGTGTGGCA CATTTTATTC 

30 

TGCTTTTTAT AAATTGTCAG ATTATTATGA 

CGATACGATA TTTATGTTTT TGTGTACATT 

TTTATTTTAT GGTGGGTTAG TTCAATCTAA 

35 

GGCAGCAATT GTGCTTGTTA CATTTGTATG 
GAATGGGAAT TTATGGTTCG GAAATTGGGA 
40 GACTCAAGAA GATATTAGCC CACATATTCC 

GTTTTGTACG ATTGCAATTT CTATTTTATC 
TCCTTATTTA TTATTCGTAG TAATATGGAC 
GGTTTGGGGC GGCGGTTGGA TTAACAAACT 
TGTTCATATT ACATCAGGTG TTTCTGGTTT 
CAAACATTCT GAATCAACAC CACATAATCT 

50 

GTGGATTGGT TGGTATGGAT TTAATGTAGG 
GCTTGCATTT ACAAATACTG TCATTTCAGC 
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ATACCATCCA TTTATTGCAG CAATTGTAAT 600 

GAGTGCATCA ACTGGAAGAA ATGACGGTTT 660 

ACACTTTTTG ATTACAGGTG AAACTAAATT 720 

AATTTTCATT GGTTCATATA TTGCAGCTAG 780 

AGACAAGATT ACAATACGAA ACAGTGCCAT 84 0 

AGTTGCTGGT GGTTGTTCTA TCGGTAACGG 900 

AGGATGGATT GCGCTAgCAT gCGATGATAG 960 

TTGTTCGTCC AATGAAAAAA GTACACCAAC 1020 

TAGTATAGAA GATTATTATG CAAATGATGT 1080 

AATAATTATG ATACACGAAT TAGGTACAGT 1140 

AGCGCAAAAG AAAATGGCAA CATTGCAATC 1200 

CACGCAAGCG ACGGAAGCCA TTCCAAATTG 1260 

CTATGAACAA ATTGATAATG CTTCATGGAC 1320 

TTTTAACAAT AAAATAGATA TTAGATTCTA 13 BO 

AGTAGTCTTT TTTTTTTTAG TTCATGAAAT 1440 

CAAAAGATGT AATAAAACTT AACGCATTTT 1500 

AAAAAAGGGA GTGGTAAGTA TGAATCTTAA 1560 

ATTAGTTTGG TTAATGACAC CAGGATTAAG 1620 

AAATGCGCTT AATACTGTCA TGCAAAGTAT 1680 

GATAACAGTT GGTTTTACAA TTAGTTTTGG 1740 

ATATACTTTT CTTAATCATG TAGGTTTTGC 1800 

TTTCGCTTTG TTTATGTTAT TTCAAATGAT 1860 

TGGTTCAATC GCTGAGAAAA TGAAGTTTAT 1920 

TGCTCTTGTA TACAGTCCAG TAGCACATTG 1980 

CGGTGTATTA GATTTCGCTG GAGGTACGGT 2040 

AGTATTAGCT ATTATGATTG GAAAAGGAAA 2100 

TATCATTACG TTGArrOGCG GTATATTCGT 2160 

TAGTGCTTTT ACATTTGATA ATATTGCGAT 2220 

CAGTGCAGGT GCTATAGGTT GGTTAATTTT 2280 
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ATTAGTTGTC ATTACTCCTG CAGCAGGATA TGTAACATAT CTTAGTGCAA CAATAATGGC 2400 

TTTAATAGGA GGTATCTGTT GTTATATTGT CATTAATTAC ATCAAGGTAA AACTAAAATA 2460 

5 

TCATGATGCA TTAGATGCAT TTGGTATTCA TGGTGTTGGT GGTATTATTG GTGCTGTTTT 2520 

AACAGCAGTT TTCCAAAGTA AAAAAGCCAA TCCTGACATT GAGAATGGCT TTATTTATAC 2580 

TGGTGACATA CATATTATAC TTGTACAAAT ATTATGTGTA ACAGCAGTTG TAATTTTTAG 264 0 

10 

TATAGTCATG ACGTTTATTA TTGCGAAAGT AATTAAATTa ATTACACCAT TATCTGTTAC 2700 

GGAACAAGAA ACGAATATAG GATTAGACAA GATTGTTCaC GGTGAACATG CTTACTTTGA 2760 

15 AGGTGAGCTA AATAGATTCA ATAAACATAT TCGATATTAG AATATATTTA CATAGAATAT 2820 

TCATTGTCCT GACATTTAAC TAAAGGTTGA TGTTGGGACA TTTTGTTATA CAAAAGTTTT . 2880 

ATTTTGAAAT CTTTTTATGA AAGAAGCAGA AATATTATTT AAAGCGGTTA CACATATGCT 2940 

AAAATAAGGC TAAGTGTCAC AAATAATGAT AGGTGAATAA GTATGAAAAA TATATCTGAT 3000 

ATTGCCAAAT TGGCAGGCGT TTCAAAAAGT ACAGTATCTA GATTTTTAAA TAATGGATCT 3060 

GTCAGTAAAA AAACAAGTGA AAAATTAACA AGAATTATAG CAGAACATGA CTATCAACCG 3120 

25 

AATCAATTTG CTCAAAGTTT AAGAGCGAGA 3150 
(2) INFORMATIOJT FOR SEQ ID NO: 344: 

<i) SEQUENCE CHARACTERISTICS: 

3^ (A) LENGTH: 3719 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

35 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 344: 
GTTATAGTGA AATTGACTCA TCACATTTCA CAGACCGTGA CAAACGCGTT ATTAGACGTG 60 
ATCATGTTAA AGAAGCACAA AGCTTAGTAG AGAACTATAA AGATACACAA AGTGCTGATG 120 
CTAGGATGAA AGCCAAACAA AAAGTTAACA CATTAAGCAA ACCGCATCAA AACTATTTCA 180 
ATAAACAAAT TGATAAGGTT TATAATGGAT TACAACGCTA ATCCAAAGTA AATTATAAGT 240 

45 

TATACATCTC GTTTTTAAAT GACAATTTAT CCCCGTAAAT ATTATAAATA ATCTTTTCAA 300 
ATTCCACATA GATATAGAGA CACTAATAAA CCTCTTTGTC TCGATATGAT AGTCTGCAAC 360 

GATTCATGTT GTAGGCTTTT TAATTTTACA AATAAGGCTA AATATATAAG TTCTGGCACC 420 

SO 

TAAAATATAG AAAATACATA AAAGTAAGTA TAGTTATTTT ATTATAATTA TTAAATTTTT 480 
ATTAATTAAT TGTAAAAATG TATAATTATA ATTAATTAAC GTTTAATATT AAAATTAACT 540 
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TO 



25 



ATCGTTTCAA TATTACTTAT AGGGATGGCT ATCAGTAATG TTTCGAAAGG GCAATACGCA 660 

AAGAGGTTTT TCTATTTCGC TACTAGTTGT TTAGTGTTAa CTTTAGTTGT AGTTTCAAGT 720 

CTAAGTAGCT CAGCAAATGC ATCACAAACA GATAATGGCG TAAATAGAAG TGGTTCTGAA 780 

GATCCAACAG TATATAGTGC AcTTnCAACT AAAAAATTAC ATAAAGAACC TGCGACATTA 840 

ATTAAAGCGA TTGATGGTGA TACGGTTAAA TTAATGTACA AAGGTCAACC AATGACATTC 900 

AGACTATTAT TGGTTGATAC ACCTGAAACA AAGCATCCTA AAAAAGGTGT AGAGAAATAT 960 

GGTCCTGAAG CAAGTGCATT TACGAAAAAA ATGGTAGAAA ATGCAAAGAA AATTGAAGTC 1020 

75 GAGTTTGACA AAGGTCAAAG AACTGATAAA TATGGACGTG GCTTAGCGTA TATTTATGCT 1080 

GATGGAAAAA TGGTAAACGA AGCTTTAGTT CGTCAAGGCT TGGCTAAAGT TGCTTATGTT 1140 

TATAAACCTA ACAATACACA TGAACAACTT TTAAGAAAAA GTGAAGCACA AGCAAAAAAA 1200 

GAGAAATTAA ATATTTGGAG CGAAGACAAC GCTGATTCAG GTCAATAATG CTCATTGTAA 1260 

AAGTGTCACT GCTGCTAGTG GCACTTTTAT AATTTTTAGA TCACGATATG ATTTATTATC 1320 

AATTCAGAAT TAAAAAAGTA AATAGTATCA AAAGTAAGTG TATTTAATAT TAGAAAATAA 1380 

AAATTTTAAA TTTAGTATTA AAATGGAATG TTACTATATA GTTCAATGTG TATTATCACA 1440 

GAAAATAAAA TAATGCTTTA CTTCTATATT TAAAAGTGTA TAATGAAAGT TAAGTAATAA 1500 

AGAGCGTGAA GAAAAATGTG AGTTATTTAT ATAGAATATT CTCCTTTTCA TTTATGAATT 1560 

TGTTACAAAA TATTTAGTGC AAAAGCACGA cGGAGGTATT CAATATGaAT AACGGTACAG 1620 

TTAAATGGTT TAATGCAGAA AAAGGTTTTG GTTTCATCGa AAGAGAAGAT GGTAGCGACG 1680 

35 TATTCgTACA CTTCtCAGCA ATCGCTGAAG ATGGATACAA ATCATTAGAA GAAGGCCAAA 1740 

AAGTTGAATT CGACATCGTT GAAGGCGACC GTGGCGAGCA AGCTGCAAAC GTAGTTAAAA 1800 

TGTAATTTTA ACTTATTCAA ACAGTCCTTA CTATAGGGCT GTTTTTTTAT GCTTTAAATC 1860 

GATAACAGTT GGTGTGGTAA AAGCACTAGC CGTTATTTTT TTGTCCAATA AATTTAGTTG 1920 

GAGATTTAAC AATATATAAT GGTTCTAAAA TAAATCGAAC TGATGGAAAA GTTTTTTACT 1980 

TTTCATCTGT CCGACTTTTG ATTTTGAATA TAAAAAAGCG CCAATACAGA ACTTTAATAA 2040 

TGACGAGAAT TAAAGTCTGT ATATGGCGAT AACAAGAAGT AATGTTAAAC ACTCAAAATG 2100 

TTTAACAATA ATAGGATACC ACATCGCATA ATATCTTACT ACTTAATTAA TAATTTAACT 2160 

AATCAACTTT TTGTTAATTT TTTATTAAGA CTGATTAATT ATTGAGAATA TTTATTGTTT 2220 

TTAAAATCTC ATAATAATTC AGTAATCTTG TTTTCATTTA AAAGGCGAAA CATTAAAATA 2280 

ATTAAATAAA AATATTGCGT TTAATTTACA GCGTCAAATA TACTTATTTC TAATGCTTTG 2340 
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ATTTCTGTGA GTATTTGGAA GCTACCATTA GGCAACGGTT TAACAATAGA CAATTGCTTT 2460 

TCCGCTTGTT GTATTAAAAA AGGTTTTGTA GATTGATTAT TAATATGCCA TTCACTCATG 2520 

5 TATGTTTTTC ACTCCTGCTT TAAAATAGGG TTAGAAAGTT TATAGTTGAG ACATTCATGT 2580 

TCAACCAAAA TTTTGTTCGA ATTCAATAAA TGTCTTGTTT AAAATAGAAA TATTGTAAAT 2640 

GTTATCGTCC AAAACTTCAC CAGTTAAGTA TTTGTTTTGA ATTAAAATTT GGCAGTTAGT 2700 

TAAGAAGTCT TGATAATCAC GATCGCAAAA ATAGTTTTCA CGTGCATCTT TAGCATCGCC 2760 

AAAAAAGTTA GCGACTGTTT CTGTTTCTCC TTTATTCGAA CGTTCAATAT ATAATTTGTA 2820 

AAATTTAGCT ATTGTATACT TTrGTrCTTT AGTTAGTTCA TTCAAAATAT TGGGCCTCCT 2880 

1$ 

GAAATATCAT TTGTAATCTA TACCCAATTT ATTGCAAAAC AAAAACTAAT TTAACTATTT 2940 

GATGAAACTG TGTTAATAAg CTTTAACAAG CCTTAGTTTG TATGGATCTA TAAAATTATC 3000 

TTTAATTGCA TAGGGTGAAA. TAATATGTAG TCCATAACTT TTAACTGATT TTTCACTTAC 3060 

ACCAAATTTA TAAGCTTGGT AGATAATTTT AGTACAATAC GTAAATTTTT TGCTGTTCAA 3120 

ATTTAATGTA ACTAGATAAC GATGATTTGT ATTCTCATAG TTTTTCTTAA CCCATTCAGC 3X80 

25 CGCTTTTTTA CCTGCACCAG GATAGCTGCA ACGATAAACT TTCATCCAAT CATTTTTGCC 3240 

ACTTGCATAA TTATATTTAA AAGATTCGAA GGATTGTGTA GTTGGTTTGT CGCCAGGCCC 3300 

CTCAATTTGT AAAATCGTTT TATCATCAA7 CGCGATACTA CAATGACCAA AAAATCscCA 3360 

CATGACAGGG CCTTTTGTAA CAATAATATC ACCAGGTTGT AATTGGAATT TGTCATCTTG 34 20 

AATTTCTGAA TACTTATTAT CTGCAATTGT TTTTGGTGAG TTTATTGGGG ATACGACAAC 3480 

GAATAATATA AGTAAAATTA TCGTTCGTTT AATATAGTTC ACTTAAAAGC TCCTTGTTGA 3540 

35 

AGAAATATAT GTAAATAGTC TTAAATTAGA ATTGTAATCT TTAATAAGCT TGtAAGACTA 3600 

AAACATATCT TAAATATTAA AGTATGAGAG TGTGAAATGT CTATTAAGAA TnAAAAACAG 3660 

TCTGAAACAT CATTGAGACG TTCCAGACTG GATATAAAAT GAATTTCATT TATAGCACA 3719 

40 

(2) INFORMATION FOR SEQ ID NO: 345: 
(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1676 base pairs 
45 (B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 345: 
T7GCGTTGCC GCACCAAGAT ATTGAATGCC TAGCGATTCC GAGTATGCAA ACTGAACGCA 60 
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CTCTTTAATA CGCGTTATCG CTTTTTGTAA ATCTGCATCA TGATAACAAA TCATAACGCC 180 

ATAGCCACCT GCTGTCGGAA GATCATCTCC CGGCTTAATT ACTAACGGGA ATTCCCAATT 240 

CTTAATCTCG TTTTCGAATT GCTCAATTTT TACAACTTTT CTTTTTGGTA AAAACTTCCC 300 

ATTTGTCCAT TCAGGTATTC TTGCTTTATT ATTTAAAGCA ACAAATAACG TTTTATCTAA 360 

TGCATAATAT TGCTGATTCA AGATTGTTTC ATCATGAATA TATTGAAAAT AAATCTTTTT 4 20 

ATTTTCCTTA TGTGCCAATT GTTTGATCAA GTTTTCGTAA GATTGCTGAT TGTTAAATGT 4 80 

ATAAATTGAG TTCGGtACTT CCTTACCAAT AACTTGAAAT AGCTGATGCA ATTTGTCTGT 540 

CGCACTAGCT TCGTGAACAA TAACAGGTAA TTGATTTGCT ATTAATAACT CCCTACCAGT 600 

TAAAAAATTA GATTGATGTT CGTCCGGTTT CAACCATGGA TTCGATATAT ACGAAGGTCT 660 

TGACGTATAG ACAACATCTT TGTCATATAA ATCACTTAAC GTTAAGTTCG GCTCATTACC 720 

20 ATTATTTGTC ATTACTTCCC ATTCCCTTTC AAATGCGCAT GCTCTTCAAT AATGTCTTGA 7 80 

TAAACGTCTT GATTTGTAAT TAACTCTAAC CCCATCAACG CCATTATTTT AGCGCCTTTA 840 

ATTAATGCTT CATCACCATG TACACTCGCA GCCGCTTCTC • TAAATCTATG CGTATGTCCT 900 

ACTAAATTAC GTGATCCTAT TTTAATATGA GGATGTATTG TTGGCACAaC ATgaCTTACG 960 

TTCCCTGTAT CCGTAGAGCC ATAACCAAAA TCATCATCAA TAACTGCTTC ACCAACTTCT 1020 

TCAGCATATT TAGCAAATAA ATCATCTAAT TTCGGCGTTT TAATGAATTC ATTCACACCG 1080 

TTTTGAATTC GACCAAATTC ATAATCACAA CCAGTCTGTA TCGCAGCTCC ACGTGCGATT 114 0 

TGATTTACTT TTTCTGTTAA TATATCCAAT TCTTTACGCG TCATTGCTCT AGTATAAAAA 1200 

35 CGAGCATGTG TATAGTCTGG AATAATATTA GCTGCTTTCC CGCCATCTAA AATCACACCA 1260 

TGCACACGTT GATCTTTTTT AATATGTTGT CGTAGTTGTG CTACACCATT AAAATAACTA 1320 

ATCATAGCGT CTAATGCATT TAACGCTTCA TCTGCATTTT CAGAGGCATG AGCACTTTTT 1380 

CCGTAAAATT TAACATCTAA AACATCCACT GCCAAAGTAT CAATCGTTTT ATAAGTTTCA 1440 

TTTCCCGGAT GAATCATTAA GGCAATGTCT ATTTGATCAA TCACACCAGC CTTGACATAA 1500 

GAAGCTTTAG CGCTACCATT TTCCCCACCT TCTTCAGCTG GACATCCAAG AACGACTACT 1560 

TTACCACCAA TTTGGTCAAT CACTTGCTTC AAACCAATTG CACCAAGAAC ACTTGCAGTT 1620 

CCAATGATAT TATGACCACA AGCATGACCC AATCCTGGCA AAGCATCGTA TTCTGC 1676 
SO (2) INFORMATION FOR SEQ ID NO: 346: 

(i) SEQUENCB CHARACTERISTICS: 

(A) LENGTH: 1294 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO; 346: 



5 





TACAG7AGGA ATCATAAAAC CTAATACAAC 


AAATACAAAA 


CCATTTAAGG 


CATAACTAAA 


60 




TGTGTTCCAA ATTTGATGGT AATTCATTTG 


TAGTTCCGTT 


TGTGCTCTAA 


TTAAACGGTC 


120 


TO 


GCGTTCTAAA 


CCATGGATTA GACGTGCGAT 


TACAACTGCA 


ATGATACCTG 


AAGCATGAAC 


180 




TTCTTCTGCT 


AAAAAGTATA CGACAAAAGG 


AGTTAATAAT 


TGAATAAAAG 


TTAAGGTATT 


240 




GTTATCTTTT AAACCTTTAT TAGCGGTTAA 


GTCTATACGT 


ATTCTAACGA 


CAACGAATCC 


300 


75 


AATAATTGCA 


CCAATAAGTA CACCTAGTAT 


TGTTGAAATG 


ATAAATTGTT 


CAACAGCTTG 


360 


• 


GAATAATGAA 


AAGGTACCAG TTACTAATGC 


AGTAACAGCA 


ATTTTAAATG 


AAATGATACC 


420 




TGCTGCATCA 


TTGAGTAAAG ATTCACCTTC 


TAAAATCGTC 


ATAGAACCTT 


TAGGTAATAA 


480 


20 


TTTTCCGCGT 


GTAATAGCAG . ATACTGCTAC 


TGCATCAGTA 


GGACATAAAA 


TTGCTGCTAT 


540 




TGCAAAAGCG 


GCTGGCATTG GTAAGGCAGG 


CCAAATCCAA 


TGTATAAAAT 


AGCCAACACC 


600 


25 


GACTACAGTT 


GCAAACACTA GTGCCATTGA 


CATTAATAGT 


ATAGGTTTAC 


GATATTCTAA 


660 


TAATTTTGTT 


CGAGAGACGT GGGTACCTTC 


CACAAAAAGT 


AGTGGCGCGA 


TAACGGCAAA 


720 




CATAAATACT 


TCAGAATTGA ATTGGAAATC 


AACTTGTATT 


GGAATAATGA 


AAATAACGAC 


780 


30 


ACCTAATGCA ATTTGAATAA AGGCAGTAGG AATTTGTGGG 


AATCGATTAT 


TGATAACCGA 


840 




ACTAATAATC ACAGCAAAAA TAAAAATTAA AAATGCTTCT 


AATAGTGCCA 


TACAATACTC 


900 




CTCAAAATTT 


TAATAGTTAA TATTTTATCA 


CTTTTAAGGC 


ATAATGACAT 


AGATATATTG 


960 


35 


ATAAAATGAA 


GTTATTTTCA AAAAAACTCT 


AGTATCGGTT 


GAACTGATAC 


TAGAGCGAGA 


1020 




TGTTTAAATT 


ATTGATTGTc ATATCTGAAA 


TGACCGCTGT 


CATTTTGTCG 


TTGTTCATAC 


1080 


40 


GCGAGCTTTT 


CAGCATTCGT TTTGTATTTT 


TtATAAAAGa 


AAAATAaAAA 


TATnAACCaG 


1140 


AATGGCGAAA 


TATAAATAGC TCCTCTTGtT TCGTCACTAA AGAATAATAA AATGAATACA 


1200 




AAGAAGAAGA 


ACGCTAGAAT AATGTAAGCA ATAGGCTTAC 


CACCAATCAA 


CTTAAATTTA 


1260 


45 


CTGTTTTTAT 


GTGCCTCAGG ATGCTTTTTC 


AAAT 






1294 




(2) INFORMATION FOR SEQ ID NO: 347: 









(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1935 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 
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ACATGATAAT GATGACGCTA TTAAAACACG TTTTTTATTT TTCATTGTTA TAACCTTCTT 
TCGTATGATT GATATTTGTT GATATGTATC GACATGTGAA TAATATCACA AAAACAGAGA 
ATATATATTT AACTATTTAT TAAATGATTT TGTTAATATT ATTAAATACT TTATCCTCTT 
TAAAAATAAT GTGTGTACAA AGTCATTAAT TTAGCAAATA TTTTTATTTA GTAGTTAATA 
ACCATCGATT TGAAATTTAT ATATAATTAT TAGCTAAATA ATATCCTGCA TCTTTCTCAT 
ACAATTTACT ATAAAtTAgC ATATCCGATA TCAGCGTTAA TAAGATCGTT GATACTAGmC 
AGTTAATTTC ATAGAACGAA ATCAAATAAC ACACTACTTT CTGCATTTTA AATTATGTTT 
AAGAAXCAnA ATTATGTTTA nATAAATATA TATACTACTT TGAAAGGTGT GAGCTTAATG 
ACAACTTTTA GTGAAAAAGA AAAAATTCAA TTACTAGCAG ATATTGTTGA ACTACAAACT 
GAAAATAATA ATGAAATAGA CGTTTGTAAT TATTTAACAG ATTTATTCGA CAAGTACGAT 
ATTAAATCTG AAATTTTGAA AGTTAATGAA CACCGCGCCA ATATCGTTGC AGAAATCGGT 



60 
120 
180 
240 
300 
360 
420 
430 
540 
600 
660 



:^CGGCrCAC CTATACTCGC ATTGAGTCGT CATATGGATG TTGTTGATGC AGGAAATCAA 
3ATAATTGGT CATATCCCCC TTTTCAACTG ACAGAAAAAG ATGGCAAATT ATATGGCCGA 
XSCACTACAG ATATGAAAGG CGGTTTAATG GCTTTGGTCG TATCTCTAAT CGAATTAAAA 
3AACAAAATG AATTGCCTCA TGGAACGATT AGATTACTGG CTACTGCTGG CGAAGAGAAA 
3AACAAGAAG GTGCCAAATT ATTAGCTGAT AAAGGCTATT TAGACGATGT CGATGGCTTA 
iVTTATTGCTG AACCAACTGG ATCTGGAATT TATTATGCAC ATAAGGGGTC TATGTCATGT 
\AAGTAACTG CAACTGGTAA AGCTGTCCAT AGCTCAGTTC CATTTATTGG TGACAATGCA 
\TTGATACAC TGCTTGAATT TTATAATCTA TTTAAAGAAA AATATTCAGA GCTTAAACAA 
ZAAGATACTA AACATGAATT AGATGTTGCG CCTATGTTCA AATCATTGAT TGGAAAAGAA 
\TTTCTGAAG AGGATGCAAA TTATGCATCT GGTCTTACAG CTGTATGTTC GATTATAAAT 
3GCGGCAAAC AATTTAACTC TGTACCAGAT GAAGCTTCAC TTGAATTTAA CGTAAGACCA 
3TTCCTGAGT ATGATAACGA CTTTATAGAA TCGTTTTTCC AAAATATCAT TAATGATGTG 
3ATAGCAATA AGCTTTCACT CGATATTCCA AGCAATCACC GACCTGTAAC AAGCGATAAA 
AATAGCAAAT TAATTACTAC GATTAAAGAT GTAGCTTCTA GTTATGTAGA ACAAGACGAA 
MATTTGTTT CAGCGCTTGT AGGCGCAACA GATGCCTCTA GTTTCTTAGG AGATAATAAG 
3ACAATGTTG ATTTAGCCAT TTTTGGACCA GGTAATCCAT TAATGGCACA TCAAATCGAT 
3AATATATTG AAAAAGATAT GTATCTGAAA TATATTGATA TTTTTAAAGA GGCTTCCATT 
CAATATTTAA AAGAAAAATA AGAACGATGC TGTCAGCTGC CCTATTCGCG TGCTGGCAGT 



720 
780 
840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
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TCAAATATCA ACAAGCACAT TTTCATTGAT TAAGTGATGT AAAACTGAAA TTATTGTGCT 1860 

GATTTGTCAT ACATATATTG ACTAATGGGC ATATAAAAAG ATAGCCTCTA ATAGTnACAT 1920 

AAACTCGTAA AAnCC 1935 



(2) INFORMATION FOR SSQ ID NO: 348: 
(i) SEQUENCE CHARACTERISTICS: 

^0 (A) LENGTH: 1351 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

15 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 348: 

CCTTTnCCTA AACAATTTTT AGATTTAGAC AACAAACCGA TTTTAATCCA TACATTAGAA 60 

20 AnATTTATTT TAATTAATGA TTTTGAAAAA ATTATTATCG CGACGCCACn ACAATGGATG 120 

ACGCATACGA AAGATACACT TAGAAAATTC AAAATTTCTG ATGAAAGAAT TGAAGTCATT 180 

CAAGGTGGTA GCGATCGTAA CGATACAATT ATGAATATCG TTAAACATAT TGAATCAACA 240 

AATGGTATTA ACGATGACGA TGTCATTGTG ACACATGATG CAGTTAGACC ATTTTTAACG 3 00 

CATCGTATTA TTAAAGAAAA TATTCAAGCT GCTTTAGAGT ACGGTGCAGT AGATACAGTG 360 

ATTGATGCTA TAGATACGAT TGTTACATCT AAAGATAATC AAACGATTGA TGCAATTCCA 420 

30 

GtGCGTAATG AAATGTACCA AGGTCAAACA CCTCAATCGT TTAATATTSlA TTTATTAAAA 480 

GAaAGCTATG CACAGTTGAG TGATGAGCAA AAGAGTATTT TATCTGATGC TTGTAAGATT 540 

35 ATTGTAGAAA CAAACAAACC GGTTCGACTT GTAAAAGGTG AGTTATATAA CATTAAAGTA 600 

ACAACACCTT ACGATTTAAA AGTAGCGAAT GCTATTATTC GAGGTGGTAT TGCCGATGAT 660 

TAATCAAGTA TATCAATTAG TTGCACCTAG ACAATTTGAA GTTACGTATA ACAACGTAGA 720 

4^ TATTTACAGT GACTATGTCA TTGTACGTCC TTTATATATG TCAATTTGTG CTGCCGATCA 780 

AAGATATTAT ACTGGTAGCC GTGATGAGAA TGTCTTATCT CAGAAATTGC CAATGTCTTT 840 

AATTCATGAA GGTGTTGGTG AGGTCGTATT TGACAGTAAA GGTGTGTTTA ATAAAGGTAC 900 

45 

AAAAGTAGTT ATGGTACCGA ATACGCCGAC AGAAAAAGAC GATGTCATTG CTGAAAACTA 960 

TTTAAAATCG AGCTACTTCA GATCAAGTGG ACATGATGGG TTTATGCAAG ATTTTGTGTT 1020 

so GCTAAATCAT GATAGAGCTG TACCACTACC TGATGATATT GATTTAAGTA TTATTTCATA 1080 

TACAGAGCTT GTAACAGTAA GTTTGCATGC TATTCGTCGT TTTGAAAAGA AATCTATTTC 1140 

AAATAaAAAT ACATTTGGTA TTTGGGGTGA TGGTAACTTA ggTTACATTA CAGCCATTTT 1200 
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GAGTCACTTC TCATTTGTTG ATGATGTCTT CTTTATTAAT AAAATACCTG AAGGCTTAAC 1320 
ATTTGATCAT GCATTTGAGT GTGTGGGTGG T 1351 

5 

(2) INFORMATION FOR SEQ ID NO: 349: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 411 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



20 



15 {xi) SEQUENCE DESCRIPTION: SEQ ID NO: 349: 

TCATCAAGTC TACGATAAAT TAAGTCCATA TCTAAAGGCT CGGGGTCGAC AGTTTGTAAA 60 

GTATAACCAA CTGCACAGTG GCTACAACGC ATATTACAAA GATTTGTAGT TGTAAATTCG 120 

ATGTTACTTA AAGTTAATTG GCCATGTTCT TTAACATCGT TATATGCTTC CCATGGGTCG 180 

TTTTGAATAC TTATTTTAGG CTTGTTATTA CGCATTTTAT AAACTCCTTA ATTGTTATTT 240 

GATACCAATT TGATACCGTT TAATCAAATA TGCTCATAGC TTGATGTTTT TTATCAGTAT 300 

ATAAATGAGA GTACGTTTGA ATTGTTTCTG TAATGTTAGA ATGCCTCATT AATTCCATTA 360 

ATAAATACAT ATCTACACCA TTATTAATTA AaTAGCTAGC GTACGAGTGT G 411 
30 (2) INFORMATION FOR SEQ ID NO: 350: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1639 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

'^^ (D) TOPOLOGY: linear 



25 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 350: 

40 

TCATTTTCAT AGGTTATTAC GCAGATCAGC ATAATAATCC ATTCCATATG AGTcCTTATT 60 

TTGGTTATGC AGCACGTCTA TTGGCAACAA GTGGCATTGA CTATACGTAT GTAAGAATGG 120 

45 CAATGTACAT GGATCCACTT AAACCATATT TACCAGAATT GATGnATATG CATAAACTGA 180 

TTTATCCnGC TGGCGATGGT CGTATTAATT ATATTACTAG AAATGATATT GCTAGAGGTG 240 

TCATTGCTAT TATTAAAAAT CCAGATACTT GGGGCAAACG CTACTTATTA TCAGGCTACA 3 00 

GTTATGATAT GAAAGAACTT GCTGCAATTT TATCTGAGGC ATCaGGCACA GAAATTAAAT 360 

ATGAGCCCGT TTCATTAGAG ACATTTGCAG AAATGTATGA TGAACCTAAA GGCTTTGGTG 420 

CATTATTGGC ATCAATGTAC GACGCAGGAG CAAGAGGACT ATTAGACCAA GAaTCCAATlc 480 
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TTAATAATAA AGGAGCGTTA TAGTGAATAT CATCTCAACA ATTtTAATCA TATTTGTGGC 600 

ATTAGAGTTT TTCTATATTA TGTACCTTGA AACGATTGCT ACAACTTCCA AAAAGACTAG 6 60 

CGAGACATTT AATATAAGCG TCGATAAATT GAAAGACAAA AATATTAACC TACTTTTGAA 720 

GAACCAAGGC GTATATAACG GTTTAATCGG AGTTTTGCTA ATATACGGTT TGTTTATCAG 780 

CAGTAATCCA AAAGAAATAT GCGCAGCTAT TTTAGTGTAT ATCATTGGCG TTGCTATTTA 840 

TGGTGGCCTT TCAAGCAATA TTAGTATCTT TTTCAAACAA GGCACATTGC CAGTATTGGC 900 

ACTCATATCA ATGCTTTGGT AAGTATTGGT GTTTGGGGGG GTGGAGATGT AGTCGGAGGT 960 

TTGGAGGATT TGAGCGAATT GTGTGTGGAC TTTAGACTCA GAGTATTTCA TCCTAATTAT 1020 

TTCAAGCAGA GGTGACAGTA GCGTTGCCTC TGTTTCCTTA TAAAAAAAtT ATTTAATGAA 1080 

GAAAACCCAT ATCTGATTTA ATTTTCAGCT GATAAATACT CCATATATTA GAATGGCTAC 1140 

20 TTTATCTATT GCATCAATCC TTTAAAACAA AAAACCCATG ATTTCGAAAT TCCCGTATGA 1200 

TGGGGTTCCT ACTCTCATGG ATCAGTTAAA TAAATATTAT CACTATCAGT TTATTATTTC 1260 

AATATTATTA ACAATATATG TAGTCGTAAA AGGAAAGAGG ACATGAGAAC TTCGGTGTTG 1320 

ATTGGCATTA CATAACGCTT CCAAACATAT TATTTGGTAA CAATAAGAAA CTATTTACAC 1380 

AATATATTTT GTATAGTAAA ATTATTTTAT AATATTTAAA TCCAATTGCA CAAGGAGTGA 144 0 

TTATCaTGGT ACCAGAAGAA AAAGGTTCTA TTACTTTGTC AAAAGAAGCA GCTATCATAT 1500 

TTGCAATCGC AAAATTCAAA CCATTTAAGA ACAGAATTAA AAATAACCCA CAAAAAACAA 1560 

ATCCATTTCT TAAATTACAT GAAAACaAAA AATCTTAATC ACTTTtATTT ATAGcATTTC 1620 

35 TAATCTCAGA AATGCTATA 163 9 
(2) INFORMATION FOR SEQ ID NO: 351: 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1816 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D> TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 351: 

AAAATCGCAT ATAGTAATAT GAATAACCAG ATTGTATCTA CAAAAAAGTA TATTGAAAAA 60 

SO CCAAGCGCAC CCATTAATAA TGCGAGAATA ATAATAATTT TTCTATTAAA GTGATGCGTA 120 

TCCGAAAATC TAGCAATAAT TGAATTTACT GTAAACTGGC TAATCGCTGC AGATGCTAGA 180 

AGTAATCCAT ACTGATTTGT TGTCATACCT AAATCTTTAG TTGCAAAAAG AACAAGATAT 240 
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TTCTyTATTT GTAaTAACGC TGCAAACATA TCCATAACCC CGCTTCTTAG AGCCCCTTTT 3 SO 

AATTnATnAA TTAGGGGCTC TTATGCAGTT GGTGCATTAG CAACCAACTG TATTCCTTTG 420 

TCCCCTTTTA ATTTATTaAT TAGGGGCTCT TTTGCTGTTG GTGCATTAGC AACCAACTAC 480 

GTTCAATTTA ACCGAATAGT TTAAAATTAA ATACAAACCT TAAATTAGTC TAAAACTACG 540 

CCrTTGGTTG TTCAACAAAG CTCGCCATGA GATTTACAAA AGAATCAACT TGTGGCAATT 600 

GCAACATGCT CGGATCATAA CTCATAAATG TCGAACGAAT CAGCGGTTCA TTATCAATTT 660 

CTACTTTTTC AAACTCAAAT TGTTCTTTGC TGATATTTTT CATCATAATT TCTGGCAAGA 720 

75 TTGTAACACC TACACCACTA ATCAACATTT CTTTGCAAGT TGCTACTTGA TCCACTGTAA 780 

TAGTTGCATG GTAATCTTGT TCTAAATTAT CGTTATACCA TTCTTTTATT TGATTTATAT 840 

AAATCGGATC AGCTTGAAAC TCTATAAATG GTAACTTTGT AACATCATCT CGTCTATTTT 900 

TTGGAAAAAT AAAATAATGA TCATCATTAA ATAAATGTGT GTTAGCTAAA TTCATTACCT 960 

TATTTCCACG AGTTATCATA ACATGATAAT CTCTATGATT TGCTTTAATT TGTTCAGTTG X020 

AACCAACTTG CACTTGTATT TCAACATTAG GAAATTGGGC ATTATATAGG CTCAAAACTT 1080 

CAGGAAGTAA GGTTTGTCCA ATCAAAGAAG AACACCCGAT TGATATTGTT CCATTCACTT 1140 

CACCAATATG TGCCTGCATT TTGTCAAAAA ATAATCGCTC TCTTTTCAAC ATGTCACGAG 1200 

CATGCTCAAT AATCATTGTT CCTTCAGTTG TTGTAATCAA TTGTTTTTTT GTTCTGATAA 1260 

AAATATCTAC TCCAAAAGCA TTTTCAATAG CTTTTAGTCT TTGTGTAACA GCAGGTTGAG 1320 

ATATATATAA AATTTCAGCC GCTTTACGTA ACGTTTTCGT TTCGTCTAAT GTTATTAGTA 1380 

AACGATAGTC TTCAATCTTC ATAATTTCCC CCCATAAATT ATTCAATTAT TGAACTTTCA 1440 

TGGCTACAAG CATTCATGAG TTCATTACTA ACGAATAATT TCACCAATTT TATTGGTATG 1500 

GCTGCAGCTT GAATTACTTA GTTTTTCTTT TGTTGTTGGT GATTTTTAGT TTGATTATAT 1560 

TGCTTAGGCT TTATTTGTTT GCTTTTTTCA ATATTAGTTT TATTTTGTGG CTTTTGATGA 1620 

TTTTTTTGAG CCTTTGCATT AATTTTATTA AAGCAGTACA TGATTTTCTT TTGGAATCCT 1680 

TTAAAATCAT TTTCTAACTC TGCCATAATT TGATGTGCAA TCATATATGC TTCATGAAAT 1740 

TGCTTXTTTG TAATTTGCTC ACTTTCTAAT GCAAACATTA AATCATCTTC ATCTACCAAC 180 0 

TCATaTcACC ACTTGG 3.816 
(2) INFORMATION FOR SEQ ID NO: 352: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 9956 base pairs 

(B) TYPE: nucleic acid 

55 (C) STRANDEDNESS : double 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 352: 



5 


GCGTTGTCGT 


CGATGATTAA 


TAAAGTATGG 


GTATACUAl. 1 










gAkTGCTAGT 


GACGTGCCGC 


CAATGACATC 


TGAAAAGTAA 


TGTuUATGAA 




w 




ACAAAATAAT 


ATGCTAAGCC 


ATAATATTCC 


CATAACCAAC 


GCACTCAACA 


CTTTTGl lAi 


ion 
Lou 


10 


TGTCTTAGCA 


GCAAGTGAAA 


TAATAATGAT 


CATTMGGCG 


AAATATAATA 


ATGTG CTUG C 


•5 A 




GTTGGAATGT 


CCACTCGGAA 


ATGAAAAGCC 


TGTATCAACG 


GCTAAATGAT 


TATATGGTCT 


1 A 




TGGACGTAAT 


ACAGTATCTT 


TAATTAATTT 


GTTCATGATG 


ACACCTGAAA 


CCAAATATGT 




15 


CACAAACCAA ACCGCTAAAT 


GCCTCTGTTT 


■ — — ^_ ^^^^^^^ 

AATAAACAGT 


ATGATTGTGA 


CGATAATGGA 


>i 




AATCAACACG 


ACACCTTTGA 


CATCTCCAAT 


TTCCGCACTA 


AACGTCATAT 


AGTAATTAAA 


480 


20 


CAAATTGTTA ACATACTGAC 


GTTGTGGCTC 


ACCGAAATAA 


TCTGTAAACC 


ATGTTAATGA 


54 0 


Tf^nr* AT AT CT 


ATATTTTTAA 


GCCATTCTTG 


ATTTGTCACT 


ACACTGTAAA 


ACATACCTAT 


600 






AGCGCGATTA 


AAAATAAAGG 


CACTGTCATT 


TTCGGTGATG 


TTAATTTTTT 


boO 


25 


ATCTATCATC 


TTACAATCTC 


CTCGTATCAT 


CATTTTCATT 


TTACAAATGT 


TATCCATAAT 


T o rv 




ATCAATGTGC 


CACAAATTTC 


ACTTTACCGA 


CAATATCAAA 


ATTATAAAGT 


TCATATTGTT 


"7 Q A 




ATGTATATTG 


CAAATAAAAC 


ATTGTATAAT 


TGAAATAACA 


ATATTTTGCT 


ATTTTCAATT 


a A n 


30 


TAGTACGATT 


TATATTTATT 


ATACAGAGGG 


GGTAAGGCGT 


ATCAATAGAG 


TTATTTTTGT 


7 u u 




CTATATAGCG 


TTAATCATTA 


CATTAGTTAG 


ATTCTTTACC 


CCTATTCATC 


CATCATTTTC 




35 


AAATTTGATT 


TACTGGATAT 


TTGTATTATA 


TTTTATTCCT 


ATTATACTAT 


GCGTTATCGG 




TTTCAAGGCC 


GAAAAACTTA 


TTGCAACAAT 


GGTCATTATA 


CCTAATTTTT 


TAGGAATACT 


X W O w 




TTATCGATTA 


TATGCCTACG 


TCACACATAT 


ACTCTTTATG 


TAAAAGGATA GTGGGCATGT 


1140 

X X *a w 


40 


CTCGCAACAA 


ATATGCTTGC 


GTCGACTTGT 


CACCATTCGC 


AAA'rrn'ATG 


ACATACGCCT 






TTCACGGGCT 


ATATTCAGAC 


CCACGCATTC ATCCACGTAA TAAACACATC 


ATGTAATAGA 






AAAACAGCAC 


ACCCAAATAT 


ATGGCGTTGC 


GCTGTTTAAC 


CAAGCATACT 


TCTATAGCTT 


1320 


45 


7AATAAGCCA 


GCAGAAGCAT 


ACCTAACCTT 


CTTAAATATG 


CTTTTCCAAA 


TTATCCTCAA 


1380 




GTTTGAATAC 


GATAATACGT 


TCACCTGTAA 


CTGTACTTAA 


ATCACTATGG 


AAGCTCATCA 


1440 


SO 


CTTTGATACC 


TGTAATTTTA AAAATGATAT 


CATTCAAATC 


TTGCTCACCG 


GATTCAACTA 


1500 


ATTCAGAACG 


TGTTCGTTTA 


ATATTTAATA 


ATCCTTCATT 


CGTACTACAT 


ACACGATATT 


1560 




CAGCTGGCGT 


TAAGATACCT TGTAAACTAA TAATCACCAT ATCTCTTAAA ATGTCTGATT 


1620 
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TTTCAGCTTC GATTTCACCT TTCGTTCTTT TCATATCACT AACTCCAATA ATATTAAAAT 1740 

TGATTACTTC ATCTTTGTAT CGTTATCACG ACATCAACTA TTACATTAAG TTTATCATTT 1800 

TTAGTATATT TTAAGAAGCT AGAACATTGT AGATATGATG ATATATTAGT TACTTAGCAT 1860 

CGCAACATAT CATCGTTAAA TCCAACTTTT AAAACGCCCT TCCTCATTAA CGCTCATTAA 1920 

ACGCAGCCAA TGATTAGACA CCTTCCTAGC GAAATGCTCA TTATTCGCGA GTAGTCTTGC 1980 

TACAACATAG TCGGGTGCCT GAATAACGAC AAGTAAACGA ATTGGCGAAT GATACATCGT 2040 

CCGATCAGCA GCCATAACAG ATTGCCATGA TAAGCCATAC ATCAGATCAC TCGCATTACC 2100 

TTGCATGACA CCAACACCTG ACGTGACGGT TTGTGTCGCT TTATTCCCAC TTCCGTAAAA 2160 

ATGCGGCGCA ACTGTCGACG CATAATATTG TAAATTAATC CATTGTGCCA CAAGTGCCGG 2220 

ACCAGAAATG ATGGTATTTA ATAATGTGCC ATCTTTATCT TTACGCCAAT CATAATTGTG 2280 

^0 TAAAAATGTC CGCCCTTCTA AATCAATGCC TTTTGTTAAT TGGCX^TCGTC CAATTATAAA 2340 

TGATGCATTT TTAGCCAATC CCCATTCTGG ACGTACCTCA CTCCAATCAC TCGCAAACCG 2400 

CTGCGCTTCT TCCACTGGAT GATTCACACG ACCAATCGTT GGCAGTTTGT CCAAACGTTC 2460 

GCGATTCGcg TGtTCAGAAA TCATCGGCAT CGCGTCATTC AATGATTCAT ATGCATCTAA 2520 

AGCAATAGAA GATAATGTGT CTGGCACATA TACCCATGCC AACGTATCAG TAGACGTATG 2580 

ATGTTCTGCT ACCGCAAAAA CAGTTGTCTC TGGAATATAC ACACCTGATT GTTTTAATCC 264 0 

TTGTCTGACA TTTGGACGAT TACATATCAT CGCTAATAAC TTAGCATTAA AACCGCTTGA 2700 

TGCGCCACCA CAAGCCCCAC ATTCAAGTGA TGCATGATGT GGATTATTGT GAGAATGACT 2760 

35 AGCATGACCT GCTAACACAA CGAACGGCGC AAATGCTTCG GTTAAATCCA TCAATTTCAA 2820 

CGCTTGTAAC GCGAAATCAA TTTGCTCTTG CTCAGTAAAT CCAACAGGTA AGTCTGATGT 2880 

TCGGTCAAAC TCACGATCAA TCGTCAACTT TGTTTCAGGC TTTTTCAACC ACTTTTGTTT 2940 

TATTTTTTGT AAAGACGCGC GACTTTTTCT AGGCATAATC GAATTGACAA TGGTACTTAA 3000 

GCTTAAAAAT GGCCCACTTA ATTCAGGCAA TAACAGACTA GGCATGACAT TATTTTTCAT 3060 

CAATTTAAAT GTGTAAAACA TCGATGACAT TGTCTGTTGC TGTTGTCGAT AAACATTCAT 3120 

ATCGTAGCGG TCTGCAAATT CTTTAATGCG ATATGCCGGC GGTACCATGA CAGGTAATGA 3180 

ATCATGTTTG AATTGTTCGT CTACGGCATC TTTTTGAATA GGTAATCCAA AGAAGCCTGC 324 0 

SO AATACCAATC GTTTCAAAGG GCCCTGCTGC TTCGATATGT CTACGAAATG GTTCTGAACG 3300 

AACATCTATA CAAAATGCAA TTTGCGCTTT CGTTGATGTG CCCATCTGAT TTAGCTCGCT 3360 

ATTATTTTCA TCAACTGCTT GTGTGTCATT TAACAATACT GAATGTGGCT GATTAGCGTT 3420 
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10 



IS 



20 



25 



30 



35 



40 



45 



SO 



TGCTTTAATT TTTTGTTTTA ACTGAGATTC GTATGTCATT TCCCAGGCAA TTAGCCATAA 
ATTTTTAAAT ACATTTTTAT TCATAGTTGC TGCAAAATGA ATAAACGTTT GAATTTCATT 
GACGTCATGT TGTAGTAATA CATCGCTAGG CATATCACTG TAGTAACACC ATGATGCAAC 
AGTTTGCTTA AACCAATTTT CCGATCTACT TTCACAATCT TTAGCGACTG ACTTAAACTC 
ATCACCAACT AGCAATTGTT CGACAACTAA CCGAATTGCC AAATAATCCG TTAACAAATG 
TTGTTCAAAG TGATGCTGTT GTGAACGGTA ATACAACATA CCTGCCCAAC CCGGTAACGC 
CAAAAGATGT CCTTCAACAT AAGCTTGGTA GTCTTCCTGA TCTATTGAAA AATGAGTTAA 
TACTGACrCT ATCGTCATTT CAGGATCATT GGGTAAGCCT TTAATCACTT GGCGCTGTGC 
TTTAGTAAAA CTATGGTCAT GTTGCGCTAA ATGCAACCAT GCATGGTAAA AACTTTGcTC 
ACGCTTCGGC ATTGTCCAAC TCGATAGAAA TTGATCGATA TAAAGTTTCG TCCATTTAAT 
CATTTGACGA TTCACTTGTT CGCTAAGTGG CTCACCTTGT TCATCTATTA TTGCATCACT 
CATCGGACGT ACATCATAGT GATGATATGA TTCAGCCATA TCACGTTTTG ATTTTTCTAA 
TAGTAGATCA GCAACAACAT CAACATTTGA ATGATTCATA TATGATGCAG GTACGTCTTT 
TAATGTTTTA ATGTTATCAA TATAAAGATT GATGTAGTGT TGCGGGATAT TGTAGTGATG 
TTCAAGTAAC ATATCAGTAA CAAGTTGATT AAAGACACTT TCATCTAATT CACCACGTGC 
CACAGCGCTT TCTATTAATG CTTTATTTGG GAAAATATCC ACATCTCGAA CATCACGTAA 
CCATTTTG CG ACATCTTCAA ACGTATCCGC TTCTAATCCT TCCCATGGAT TTCGTGCTGC 
AAAAATCGAA ATTGGTGATA ATGGTGTAAT AACACGTTTC GCATTTTCAA TGACTGAATT 
GATATTTAAC TGTGTTGXCA TACCTTTCAC CTCCTATAAA TACTTCTTCA AATAATTCGG 
ATGACTTTCT ATCGCTTTCG AGCGTGCTTC ACCTAGATTA ACTAACCACA CGTACAATAC 
CGCAAAAGCC TTAGAGTATC GATGCCGCGC CACCCAAATA CTTAATAAAC TGCCAAAGAT 
TAAAATAACA ACACTAATGA TGACACTCAC TGTAGGCGGC GTTGTCGCAT GTGTTGTTAT 
ATTTTGTAAT ACAGCGTAAA AATAATTATG TGTGATGACG TAGATAAATG TCACGATTGC 
AATCAAAATC ATACCAACAA GACGTGCCAT GCGTCCTTTA CTAAAGGCTA CCATTTGATT 
CCAAGATACA AGTAATGACC ATCCTAGAAT GAGTGCACTT AACACTTCAT ATGCACTTCT 
GTCACTACTC ATCCAAAATA GAAATGCCAC GATAATAGCT AATACACGTC CCATGACAAT 
CCAGCCATAA GCGTCTTTAG CAGATGCTTG TTTTGGAATA TTGAATCGCT TCACGATAGA 
ACCTGATTGT AAAAATAATG TTGCTTTAAA AATACCGTGC AATATTAAAT GAATAATCGC 
TGCTGAATAT ACACCCAATG CACATTGAAC TAACATAAAG CCCATTTGAC TCATCGTAGA 



3540 

3600 

3660 

3720 

37B0 

3840 

3900 

3960 

4020 

4080 

4140 

4200 

4260 

4320 

4380 

4440 

4500 

4S60 

4620 

4680 

4740 

4800 

4860 

4920 

4980 

5040 

5100 

5X60 

5220 



55 



1234 



AGAAATACTA GAAAGGATAA GTAATAATGA 
AAAACGAGTT AGAATAACAC CACCTGCATT 
^ TGGCGTTGGT GCCGTTACAG ATTCAATCAA 
TATCATGACA GCTAATACAA GTAGTACATT 
ATGTTGTGGT ACCCGCCACT CGCCAGTCGC 

10 

TGCAAGCCAA CCACATAAAA ATGTCATGCT 
CCAAAAACGA TTAACGTTCA TCAGCAATGT 
TGCCATCAGT CTTAAGTCTT CAGACATCCA 
GAACAATGGA AAGTAATGTC TATAATGATG 
TTGAATAATA AAGCCAAGCG CCATTACAAA 
20 TTTAAATGGA CCTAAGACAT GTTGACCATG 
TACTGGCATG ACTAGTATGT ATAAATGTAA 
TAAAAACAAC AAGCCACTTA TCAATGCAAT 

25 

CAATTGAAAA CTTAACACTG CATAACCTCC 
GTATAAAAAT AAAAACCTAC AATAGTAGAT 
GCAGGTTTCA GTTTAACTAG ACACTGCATC 

30 

TCTCTTTAAG CGTGCTCCCA TGCACATATG 
TCATCTTCAT AAATATGCTT TGCCTAGACG 
'35 TAACATAAAA TATAATTAAA TTTCTGCTTC 
AACCAATGAT TGTAAAGATT TTGTAAATGC 
TTTTAAAATA AAAAATTCGC AGTTATGATC 
TACGCACAAG ATAACTATGT ACAATGAAGT 
GGGTATCATC GCTGGCATCA TTAAAGTTAT 
ATAAGATTTC ATAACAAACA AAGGAGGTCT 

45 

AATTCATTAA AGGATTAATT GAGAAATTCA 
TATGAACATC TTATTTGAAG GGGGCCATTC 
SO TCTTTAAAGA TTTACTTGGT AAATTTTTAG 
ACAACTCATC ACTATGTTAA ATCAACATAC 
CTATCATTAA AATCATCAAA GCAATTATCG 

55 
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TAACGCAAAT CCATTATCAA ATATCGGCGC 5340 

CACAATTCCT GCATGCATAA TTGCCGATAC 5400 

CCATCGATGA AAAGGAAATT GTGCTGCCGG 54 60 

CGTCAACAAT GACCATGTCG GATGAACTAT 5520 

AATATAAATA GTTACAATTG CTCCAACGAA 5580 

TGATAATTTC GCAGACTCAC GTGGCACTTT 5640 

TAAACATAAT AATGTAATAC CCCAGCAGAG 5700 

TGCTAAAGAT GCAAACGACG TAATCGCAGT 5760 

ATCACCTAGT AAATATCGCA TTGAAAACTT 5820 

GCCAGCTAAT AACCAAGATA AACGATCTAT 5880 

AATACCGAAA AAGCCAATGA CTGCAAATAA 5940 

TTTAATATAT CTCATTGGCA TAACTGGTGC 6 00 0 

GATAAGCGCA ATAACAAACA GTGAAAATAG 6060 

TTATTTCTAA TCTCTCGCAT AATTGCTTAT 6120 

TCTGTACATA ATGGCAGAAA ATTTACTATT 6X80 

ACGGTACGTT GATATACCTT GTTGCAGTGT 6240 

TATATAAAAT GTTACTTCTG TCTGTTCAAT 6300 

AGACCTAACG TGTTATTCGT TTTAAACTTA 6360 

ATGTCAAATT CATGAGCTTA ACCTCTATTA 6420 

ACCTGTACAG TTAGGCAGTA TTTCCCGXCC 6480 

ATAACAATTC AAGTTAGGAA AAAAATCAAT 6540 

TAACTCATAA GCAAAGGAGG TAATCTTAAT 6600 

CAAAAGCTTA ATCGAACAAT TCACTGGTAA 6660 

TTCACATGGG TATCATTGCA GGAATCATTA 6720 

CTGGTAAGTA AGTTATAAAA ATCTCATAGA 6780 

ACATGGAATT CGTAGCAAAA TTATTCAAAT 6840 

GTAACAACTA ATCTCAAACA TTAACGATCA 6900 

AGGAGGACAA AACGATGGCT ATTGTAGGTA 696 0 

ACATTTTCGC AAAATAATTT AAGCGAATTG 7020 
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TTATTGATGT GAGGTGAGTC TTGTTAGTTT GTTGCAAATA AATGGTCTTG GTGTTTTTTG 7140 

TATAGGACGT TCTTAGTGGG ACATACGGAA TATTCGTGAT CTTTGTAGTC TGACGCGTTA 7200 

^ TATTTTTGTG GCGTGTTTTA TGTTTGATAC TCGAGTTCTG AGACATTCAT GATTTGGCAT 7260 

GCGAAATCTT AATGATTTTC ATGATCTAGC GCAAGATATA TTGGCCACGT GCGGAATTGC 7320 

GTTGCACGTT TAGACTGAAA CACTCGTGTG ACCGTAAGTG TTAATAGTAC ATTGATAGCT 7380 

10 

GCATTTACTT CACTCATTTT TATGACTGTT AAACAATGAT TGTACCTTCA ATTAACAGTT 7440 

GGTACGATGG TTTTGCCATT TTTCATCAAC GTAAATATAA AAAGGACTAA GACACATACA 7500 

15 TCTCCTAGCC CTATGGATAA AATGCAAATT TCTGCTTTAT CAAAACTATC ACACTTTAGA 7560 

TAGATTGAAA ACAAAAAGAT CCTAAGAACA CCTTAACTTT TTATTAATTG TCATAAATTG 7620 

CAAACAATTA AGCCACAATT CAAAAATGAT TATACTTCAT TCAACTTATC GTGCTGGTCT 7680 

AATTTGCCAT TGATATGGAT CTTCAAATTG TTGCCAATCT GCATCAATTT CTTGCGCATT 7740 

GACTAAGCAT GCGTCGAGTT CTTTTGTTAA TTTTTCTTCA TCTAATTCTG TACCAATAAT 7800 

GACAAATTGT GTATGACGAT CGCCATATTC TGGATCCCAT TCAGCTGCGA CATCTTGACG 7860 

25 

TTCTGCTAAT ATTTGTGTTT GTTGCGCTTC AGACATACTA GCCACCCAAT ATGTAACTGG 7920 

ATGAATATTG CAAGATGACC CTGCTTGAGA TAATAAACAT GCTACGTGAT TGTATTGTGC 7930 

TAGCCATACG ATACCTTTTG ATCGAACGAC ATTATTTGGC ATGCTTTCTA ACCAATCATT 8040 

30 

GAACCTTTTA GCATGGAAAG GTAGACGACG TTTATATACA AACGATGATA TACCATATTC 8100 

TTCTGTTTCA GGTGTATGCG ATGCATGCCC ACCAGACTCA AGTTCTTTGA TCCATCCTGC 8160 

3S TGACTCGCTC GCTTTTTCAA AATCAAAACG CTGCGTATTC AAGACTTCTT TTAAATCTAC 8220 

TTCAGAATTT GTTGTCTTAA TAATTTTAGC AGTCGGTTGC AATGCGCTTA ACATTTTTTC 8280 

TAACTTCGCT AGTTCTTCTT CACTAATTAA ATCAATTTTA TTAATAATCA ATACATCACA . 8340 

40 

AAATTCAACT TGGTCAATTA ATAAATCAGC AATCGAACGC TCATCTGTTT CGTCAACGCT 8400 

TTGATCACGA TCCATCAATA AATCTTCTGA GTTGATGTCA TGTACGAAGC GGTTAGCATC 8460 

CACAACTGTA ACCATTGTAT CTAAACGGCA AATCGCTGTA AGATCAATGC CAAGTTCATC 8520 

45 

ATCAATATAT GAGAAAGTTT GTGCAACAGG TACTGGCTCT GAAATCCCTG TTGACTCAAT 8580 

AACAATTTGA TCGATGCCAC CTTTTTTCAC TAAACGCTCA ACTTCTTTTA ATAAATCGTC 864 0 

SO TCTAAGTGTA CAACAGATAC AACCATTAGA AAGTTCGACT AATTTTTCAT CTGTACGCGA 8700 

■ TAGTCCCCCA CCATCTGCGA CAAGATCTTT ATCGATATTT ACTTCACTCA TATCATTTAC 8760 

AATTACCGCG ATACGTCGAC CTTCTCGATT TTGTAAAATA TGATTTAACA ACGTTGTCTT 8820 
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10 



20 



ACTTCAATTT ATTTGTAAAT AGGAATAATT CTGTTTTACA TTATATAGGA GCGTTTCCTC 8940 

TTTCGCAATC TTCGATAATA AAAAAATAGT ATACTTAATT AAATTATTGA GCX3CTTTACT 9000 

TTATAATGGA GACAAAGATA TATCTCACGA AAGAGAATCG AGGTGTATAA ACATGTTATT 9060 

TGTCATTTTA GTTTTATATG TTACTGGTAT TGCATTTATT CTACTCAGTG TTTTTGGTTC 9120 

AAAGACTGAA GGATTATCTA CGAAACATAC TTTATATACC ATTGGCAGTG CTATTATAAC 9180 

GATTGCTATT TTCATTTCAA TTGGCTATGC CATTCAATAC TTAACTGCAG CGCTTTATGG 9240 

TTTGTAAGGT GAAGGTGATG AGTAACGGGT AGTTCGGGAG AGGTTAACTT GCGTTGATTT 9300 

15 TGATAAAGTG ATCATAGCTT TTAGTACTTG AGGATTTTTA TTGTTGCTGT TACGAATGTG 9360 

GTCATGTTTA ATGCGGGACA GTAATTTAAG TTGTTTTTTT ACAATTGAGA GTGTGATATT 9420 

TCGATTCGGT TCGAATTACT TTACATGGGA ATAATATAAA TTAAAAAGAA GCGGCCTAGT 9480 

GTCAGT-XGTG AATATACTGA ACATTGGTCG CTTTATTTAG TAGTATGATA TGTAGTTTAG 9540 

CTATTAATTT TTTTCAGGTC ATCCTTAATG CTGTCTATCT CAGACATGGC ACTTTTAACC 9600 

CAATCTCCTT GAGCTGCACC TTTAAAATTA GCTTTAAAAg ctTCGCAATG TTGCGCCATT 96 SO 

TGTT.CAATTA ATACTTTTTC TTCACCTTTT AATCCGTTTT CAATATCTTT GTATTTATGC 9720 

TTATGTTCAG GTGCAATAAC TGTGCGAATA TTTTCTTTTT GCGCTTCCAT TTTAGATATG 9780 

AGATTAAGTG TTTCTACTGT AGTACTTATA TCTGGCATTC TTAAGGTCAT ATCTGGTTCT 9840 

ATTAGAGTCA TTTAATCTCC TCCAAATTAT CAGTCACTTA GCTTATCTAA CTGCTTTTCA 9900 

7AAGACTTTT TTAAGTCTTC TTTATATTCT TCTAATTTCC CATTCTTGCT TTCTGA 9956 
5^ (2) INFORMATION FOR SEQ ID NO: 353: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2411 base pairs 

(B) TYPE: nucleic acid 
4Q (C) STRANDEDNE3S : double 

(D) TOPOLOGY: linear 



25 



30 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 353: 

TTTCTTTTAA CAGaTTTATC cCATTAATTG TTCTACAAGC CCACGaTGAG CAATATCATT 60 

TTTAGCAACC ATTAATAAAC CAGAAGTATC CATATCTATA CGGTGAACAA TACCTGGACG 120 

SO AATTTCTCCA TTAATACCTG ACAAATTTTT AATTTGATAC ATTAAACCAT TAACTAATGT 180 

ATTGGTATAA TGCCCTGGTG ATGGATGAAC TACCATGCCT TTCGGTTTAT ATACAACTGC 240 

AACATCGTCA TCTTCATAAT AAATATCTAA ATTTAAATTT TCAGGTAGAA TATCAGCTTC 300 
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AACAACTTTA TCGTTTGCAA CGACTAAACC 
AGACCAATCA TTATTTAATT CAGGCAGCAA 
^ ATCTGTAATG TTAAATTCAT AAGTCTCCAT 

GTATCCTTTA ATAAGGCAAT AATAATTAAT 
ATATTAAATA TTGGAAAATC ATAACCAAAA 

10 

CCTGTTAAAA TTCTATCAAT AAAGTTTCCA 
ACTTGCATAA ACAAATTATA TTGAGCATCT 
^5 ATAATAATGG TAATAATAAA GAAAAATGTC 

CCATTATTTC GATGTGaTGT TATGTTTAAA 
ATTTTCATTG TAGTAGCTAT AATATATTTA 
GCTATTAAAA TGGAAGTGCC AATAAAATAT 
CGTCCATGAG ACAACTCTTT ATATTATAGC 
TTACATTAAA TCTAATGTTA CTAACTCAAT 

25 

ATATGAACTT AATTATTCAT TTATCATATT 
CTGGAACATA AATCCCTAAA AAGACAGTAG 
CTGCTGTTCT CTATTTATAC AATACTTCGT 

30 

CATTACTGTA AAATTCTATA AATAGAATTT 
CTCAGCCTCG GtCTTCGACT GGCACTGCTC 
35 TTAACATGTA ATTTTACTTT TAAATACTTT 

AATTGGACAA ATTCTATGAG AATAGATATT 
TtCACTCGAA TGTCAGTTCG AGGAATAAAT 
ATGGCAATTA ATATAAGGAA AATAGCAGCT 
AAAAAAGCTG ATTTCTATCA AATAATTAAT 
CTTAATGTCC CAAGCCCTAA AACTTGTTGT 

45 

TATCTTAAGT ACATAAATGC TAAAAGTATA 
CTTGTATCAA CATTAATAAA TAATAACCCG 
gQ TAGCCCATAT ATTTGCCACC TAATAGTTTG 

TTACGACTAT AATTGATATA TGCAATGATA 
GTAGAGATGG TAGTCACATA CGTAAATACT 

55 



TGCTTTAATC CAATCTTGTA TCTGGTTACG 420 

CTTATCTACA CGCATACCTG TTTGTTCTTT 480 

TACTTAACCT CCTTCTCCTT TTTATTGGAA 540 

ATTACACCAA TTGTTAAACT TGAATCTGCG 600 

ATATTTGTAT CAATAAAGTC AACAACTTCT 660 

AGTGCACCTG CAAAAAGTAA ACTAATAGCA 720 

TTAATAAAGA AATATACTAA GGCTATTAAT 780 

ATTTTTCCAC TCAATATTCC CCATGcAGCA 840 

AAGTGCGGTA TCACTTCAAA TGAATCTCCA 900 

GTAACTTGGT CAAATATAAC GACAAATACT 960 

TTTTTGTGCA TTTTCGTTCC TCCAATCAAT 1020 

TTACACCTGC TAATAAAAAA AGTAAGCATA 1030 

ACTTGATAAA CTACTATGTT TTGACATTAA 1140 

TAAGATGACA TTAAAAATTA GGAAAGCAGG 1200 

TAAGATATTT TCTAATTAAA AATTATCTTA 1260 

ATTGAATGGC TTCGCTATGC CCATCTGGCA 1320 

TTGATGATGG GTCCCTTCCT AGGGTGCCGT 1380 

CCTCAGGAGT CTCGCCATTA ATACTACGTA 1440 

AAAAAAATAA GACATGAATC GTCTACACTT 1500 

GTTAATTTAA GAAAGTAGGC TATTTTGAGT 1560 

AAAGTTAAAC GAGAGCTAGG TTTTGTATTA 1620 

CAACGAGCTG TACATTATAA AATACATATC 1680 

AGAAATCAGC TTTTTTACAT TGCCTAAGAA 1740 

TATTTATTTG ATTTAGCAGC GATACGTTTA 1800 

AACCAAATCG GAATAAAATA AATTGCACGT 1860 

AACACAAAAA TGAAGAATAC AAATATTAAG 1920 

TACGTAGCAT TTTTATGTAG ATCTGGGTTT 1980 

ATCAGACCCC ATACAACTAA AAATAACACT 2040 

TTTGTCGCAT CTGGGAAAAT ATAGTTTAGT 2100 
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TTATTCGTCT TAGAAAAGTT CGGAGGTGCT TGTyGTTGAC TTGATAAACC GaAAAGCATA 



2220 



CGGCTATTTG AGAATATACC ACTGTTACAT GATGAAGCAG CAGCGGTTAA TACTACAAAA 



2280 



TTAATCAAGC CCGCAGCAAA CGGAATTCCG ATCAATGCGA ATrATTTTnC GAATGGACTG 



2340 



TTATCAGGAT CAACTTGCTG CCAAGGGGTA ATAGACATGA TAACCGCTAA CGCCCCAACG 



2400 



TTnnATATTA A 



2411 



10 



IS 



20 



25 



30 



35 



40 



45 



$0 



(2) INFORMATION FOR SEQ ID NO: 354: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 605 base pairs 

(B) TYPE; nucleic acid 

(C) STRANDEDNSSS : double 
(D> TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 354: 

GnGAATTATT TTTAATAATG AAAGGATTAC TTnCATGGGT TTTTACTAGG AnTACCCAGA 60 

AGGTCAAAAT ATTTTTGATG CGCTAAGTCA ATATGAAGTT AAGCGACGCG GCGATATGGA 120 

AGAGGATCCA TCATATAAAC AACTCATTTC TTATTGTTTA CTTGAAAATG AGCATGGCGA 180 

GATATTAGTG TATGAACGAT TATCTGGCGG TGGAGAAGCT CGATTGCATG GACAATCTTC 240 

AATAGGTGTA GGCGGTCATA TGAATGATGT TCCAGGAGCA GAATCTATTA ACGAAGTATT 300 

GAGAGTTAAT GCACAGAGAG AATTAGAAGA AGAAGTAGGT TTAAGTGAGC AAGATTCACA 360 

AAATATGGAA TATATCGGTT TTATTAATGA CGATAATAAT GAAGTGGGCA AGGTACATAT 420 

TGGTGTTGTA TTTAAAATCA CTGTAAGTAC GAATGATGTA GAAGCTAAAG AAACAGATAC 480 

TTTACGAATA AAATGGGTTG AAAAAGGCAA CATAGAGTCA TATGATGATT TCGAAACGTG 54 0 

GAGTGCATTA ATCCTTCAAG ATTTATAATC AAACGAGGTG ACATATATGT CAGATATTAT 600 

TCCAG 605 
(2) INFORMATION FOR SEQ ID NO: 355: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 668 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : doxible 
(D> TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 3 55: 
TTTATTAGCA CATCCAAACT ATTCATATGT TGGACAATTT TTAAACGAAC TAGGATTTAA 60 
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70 



ACAATTAGAC ACTGAACATT TAGCTGATTT AAATCCAGAG CGTATGATCA TTATGACAGA 180 

TCATGCTAAA AAAGATTCTG CTGAATTCAA GAAGTTACAA GAAGATGCAA CATGGAAAAA 240 

GTTGAATGCA GTTAAAAATA ATCGCGTGGA TATTGTTGAC CGTGATGTTT GGGCAAGATC 300 

TCGTGGCTTA ATTTCTTCTG AAGAAATGGC TAAAGAACTT GTTGAATTAT CAAAAAAAGA 360 

ACAAAAGTAA GGTGGAAGTA AATGGCTATA AAAGAAATAA GTAGCCAATC TGCCATAGAT 420 

CATAAAAGAA AAAGACGCAC AACACTCACG TATATAGTGA GTTTGTGCTT TCTTTTTATT 480 

TGTATATATT TAAATATGGC GATTGGTTCT TCGAAAATTA ATTTTAGCGA TATCATTCAC 540 

TATGTTACTG GTCATACAGA TACGAAAGCA ACGTTTTTAT TGCATAATGT ACGTATGCCA 600 

AGGATGATTG CAGGGTTATT TATTGGCGGT GCATTAGCGG TATCTGGTTT GTTAATGCAA 660 
GCAATGAC 

20 (2) INFORMATION FOR SEQ ID NO: 356: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 737 base pairs 
(3> TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



75 



(xi) SEQUENCE DESCRIPTION: i 

30 

ATACAAAAAA ACATATCGAA AATAAAGCTA 
ATTTAAATGG TACATCTACA AACATTTTAT 
CAAATTACAA AAATTTAACT AGTCAAATAA 
GTGAACAAGA TTTAAAATAT GCTAAGAAAG 
GTAAAAGAAT CTTACAGTTG AATTCAAAAA 
40 ATGTTAAGAG AATTGAAATT ACTGTTAAAA 

TACCATACAC AATTGCAGTA AATGGCACAT 
CGAATAAACA ATTAATTAGT TACAAATATT 

45 

GTGAAAGAGG CATCAGTGAT CTTGACTTAA 
ATTTCAAA^^ TGGAAAGAAA CAAGTAGTGA 
TATTTAGTGC CAAAGATATT AAAAAGATTG 

SO 

AAAAAAATAA ATAAATCTAA TAATGTGAAA 
ATAGTTTCAA ATGAATTTGT GTTCTATAAT 

55 



EQ ID NO: 356: 

AAAGAAACTA TCAAGTTCCA TATTCAATTA 60 

CGAATCTTTC ATTTTCAAAT AAACCTTGGA 120 

AATCAGTACT GAAGCATGAT AGAGGTATTA 180 

CTTATTATAC TGTTTATTTT AAAAATGGTG 24 0 

ATTACACAGC AAACTTAGTT CATGCGAAAG 300 

CAGGAACTAA AGCGAAAGCA GACAGATATG 360 

CAACACCAAT TTTATCAAAA CTTAAAATTT 420 

TAAATGACAA AGTGAAATCT GTATTAAAAA 430 

AATTTGCGAA ACAAGCAAAA TATACAGTAT 540 

ATTTAAAATC AGACATCTTT ACACCTAATT 600 

ATATTGATGT AAAACAATAC ACTAAATCAA 660 

TTCCCAGTAA CAATAAATAA ATTTGAAAAC 720 

GCAAGCAAAA TTACmATTAA TGaTTTAAGT 780 
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(2) INFORMATION FOR SEQ ID NO: 357: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 534 base pairs 
^ IB) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

TO 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 357: 
AAAGTAAAAA TAAATCTCCC TTTTTAACTT TCGTTTCTGC CATAGCCATT GCTTCTTCTG 
TGATAGTTGC TACAATATCT TTTCTTTCAC GGTTAAAATG TTCAACTTGT TCTGCTAAAA 

15 

ATGCAGCTTC TTCTTCGACG TCAGTCATCA ACAATTCGCa AGCTAATGAT GCGTCATCTA 
AACGACCTAC AGCATTAAGT CTAGGTCCAA TAATAAAACC AATTGTTTCT TCATCAATAT 
20 TGTCATTGTA TCCCGCTTCT TTTAGCAATG CTTTAACAGA GGTCGGACAT TGATCATTTA 

AGACTTTTAA TCCTTGTtTC ACTAATGATC GATTTTCATC AGTTAAGGAT ACTAAATCCG 
CAATGGTACC TATCGCAACT AATGCTTTAA AATAATCAGG TACATTTCCA ATCAATGCTT 
GTGCTAATTT GTATGCAACA CCTGCACCAC ACAATTGTTG GAACGGATAA TTAAACGATG 
GATGCATTGG ATGTACGATT GCATATGCTT CTGGTAATGT ACTACCAATT TCAT 
(2) INFORMATION FOR SEQ ID NO: 358: 

30 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3621 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 
._ JDI. TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 358: 

GGTGAGTCAA ATTAAATGAA TCTAATAAGT CATAACTATC TATTTGTAAT GTGCAACGCT * 60 

TAACGCATAT ACAAAATGAA TGTGCTGATA ATGATTTACT CAAATTAAAA GGTGATTTTT 120 

ATTCAATGAT GAATGAAAGT TGCCTTTTTA TTTTTGGTAA AAGTTAATGC GTCAGTGAAT 130 

TGTGTAAGTT TTTCAAAAAG TAAAAAGAAA TAATAAAGGT GAATTATTAG AATTCCArAA 24 0 

ATAATTCATT ACATTCATAA AGCATTTTAC AAATGGTAAG AAAATGAGTG TTACAAATCT 300 

AAATATTGCA AAAGAAGCTG ATTTAGTCAC AAAAAATGTC CTATGTAATA ATTCGAGAAA 3 60 

GATGCACTAT ATACGGTCTT CTTACTATTC AAATGTAAAA GTTGCTTATT TGCGTGGCTT 420 

TTTGTTTTAT AAAAGTATAA AATTTTACTA TAATATATCT TGTAGAGAAC AATGAAATGA 480 
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ATAGCAAACT GTATTACTTT GATACAAAAA 
ACTTGAATAT GATAAAGTGA CATATTTATG 

5 

GTAGAATTTC TTGACAATTC TGTCAGTTTA 
AGGCAAACAA GATGACTGAA GAATTCAATG 
ACAAAGTCAC TGGCGAGGTA CAACAAGTTG 

10 

GTGGTAAATT TAATGGGATT ATTCCTATTA 
CAAGTGAAGT TGTAAAAGAG GGCGACGAAG 

,5 ATGAAGAAAA TGAAACTGGA GCTTACATCT 

CTTATAGTTA TTTACAAGAA AAATTAGATA 
AAGTAGTTAA AGGTGGTTTG GTTGTTGATG 

20 TAATTTCAAC AGACTTCATT GAGGATTTCT 

AAGTTGAAGA ATTGGATCCT GAAAATAATA 
AAGAAGAAAA CGATGCTAAA AAAGATCAAT 

25 

TTGATGGTAA AGTAGCGCGT TTAACTCAAT 
ATGGTTTAGT GCATGTATCT GAACTTTCTC 
TTTCAATTGG TCAAGATGTT AAAGTTAAAA 

30 

TTTCATTATC AATCAAAGAT ACGTTACCAA 
ACGAAAATGA TGTCATTGAA GGTGTCGTAG 

35 AAATTGCACC AGGTGTACAA Ga^^CTTGTAC 

GTACGCCAGG TGAAGTGTTA GAACCTGGTC 
ATGAAGAGAA TGAAAGAGTA TCACTATCTA 

^0 TTGAAAGTGA TCCTTCTACG ACTAAGGCGT 

CAATTGGCGA TATGATTGGT GATAAACTTA 
AGTCAACTCC ACATGTTTAT GATTGcATGT 

45 

GAATGATAAC GTGGgACAAA TTTAACTAAG 
tTTTTATCAT TACAGTAATA AACTCATTTT 
AAGATATaAG AAAGAGAGGA AGTTAGCTTA 

SO 

GGCCTAATGT AGGTAAATCT ACAATTTTTA 
TGGAAGACAC GCCAGGTGTA ACACGAGATC 

55 



TGGTTGTAAT AAATATTTAT CGATATGACXJ 600 

TATATGACTA TTTCGCAAAA TGTAATCGAG 660 

TAAGATGTTA TAAATATGTA GTGTATAAGG 720 

AATCAATGAT TAACGATATT AAAGAAGGTG 780 

AAGACAAGCA AGTTGTTGTT CATATCAACG 840 

GTCAACTATC TACGCATCAT ATTGATAGCC 900 

TTGAAGCATA TGTCACTAAA GTTGAGTTTG 960 

TATCTAGAAG ACAACTTGAA ACTGAGAAGT 1020 

ATAATGAAAT CATCGAAGCG AAAGTAACAG 1080 

TAGGACAAAG AGGTTTTGTT CCGGCTTCAC 1140 

CTGTGTTTGA TGGACAAACA ATTCGTATTA 1200 

GAGTCATTTT AAGCCGTAAA GCAGTTGAAC 1260 

TATTACAATC TTTAAATGAA GGCGATGTTA 1320 

TTGGTGCATT TATAGACATT GGCGGTGTTG 1380 

ACGAACATGT TCAAACACCA GAAGAAGTAG 1440 

TTAAATCTAT TGATAGAGAT ACAGAACGTA 1500 

CACCTTTCGA AAATATTAAA GGTCAATTCC 1560 

TAAGATTGGC AAACTTTGGT GCATTTGTTG 1620 

ATATTTCTGA AATTGCACAC AAACACATTG 16 80 

AACAAGTAAA TGTTAAAATA TTAGGTATTG 1740 

TTAAAGCAAC ATTACCAAAC GAAGATGTTG 1800 

ACTTAGAAAA CGAAGAAGAA GATAATCCAA 1860 

AAAATCTTAA ACTATAATTT AATATTTAAT 1920 

GGAGTATTTT TATGTAACAA AATATACTCG 1930 

TGTTTAAAAA GATArAGTTT TAAGTGCtGa 2040 

GAATACACAG TCTCATGTGA TATTATTAAA 2100 

TGACTAAACC TATAGTAGCT ATTGTAGGTA 2160 

ATAGAATAGT TGGAGAACGT GTTTCGATTG 2220 

GTATTTATTC TTCAGGTGAA TGGTTAACAC 2280 
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AAATTAGAGC GCAGGCAGAA ATCGCCATAG ATGAAGCGGA TGTTATTATT TTTATGGTTA 
ACGTGCGTGA AGGATTGACA CAAAGCGATG AAATGGTCGC TCAAATTTTA TACAAATCTA 
AAAAACCGGT CGTATTAGCG GTTAACAAAG TAGATAATAT GGAAATGCGT ACAGACGTGT 
ATGATTTCTA TTCATTAGGA TTTGGTGAAC CGTATCCGAT ATCAGGGTCA CATGGTTTAG 
GTCTTGGTGA CTTGTTAGAT GCAGTTGTTT CTCATITTGG TGAAGAGGAA GAAGATCCTT 
ATGATGAAGA TACAATTCGA CTATCCATTA TTGGACGACC AAACGTAGGT AAATCAAGTT 
TAGTAAATGC TATTTTAGGT GAAGATCGCG TTATCGTTTC TAATGTTGCA GGGACAACGA 
GAGACGCTAT TGATACAGAG TATAGTTATG ATGGACAAGA TTATGTTTTA ATCGATACTG 
CTGGTATGCG TAAAAAAGGA AAAGTATATG AATCAACTGA GAAATATTCA GTATTAAGAG 
CTTTAAAAGC GATTGAACGT TCAAATGTTG TTTTAGTGGT CATAGATGCA GAACAAGGCA 
20 TCATTGAACA AGATAAACGT GTTGCAGGAT ATGCACATGA ACAAGGTAAA GCAGTCGTGA 
TTGTCGTAAA TAAATGGGAT ACTGTGGAAA AAGATAGTAA AACGATGAAG AAATTTGAAG 
ATGAAGTACG TAAAGAATTC CaATTTTTAG ATTATGCACA AATTGCTTTT GTGTCTGCTA 



IS 



25 



30 



35 



40 



45 



AAGAACGCAC AAGATTACGT ACATTATTCC CTTACATCAA TGAAGCAAGT GAAAACCATA 
AAAAACGTGT TCAAAGTTCA ACTTTAAATG AAGTrGTTAC TGATGCAATT TCCATGAACC 
CTACACCAAC AGACAAAGGT AGACGTTTGA ATGTCTTTTA TGCAACACAA GTTGCTATAG 
AACCACCGAC ATTTGTTGTA TTTGTTAATG ATGTAGAATT AATGcATTTT TCTTATAAAC 
GCTATTTAGA GAATCAAATC CGTGCCGCTT TTGGTTTTGA AGkTACACCA ATTCATATTA 
TAGCTCGAAA GAGAAATTAA CGATTGGGGG ATAACAATGA CTAAAATTAC CGTTTTTGGT 
ATGGGAAGTT TTGGGACAGC CCTTGCCAAT GTTCTTGCAG AAAATGGACA TGATGTTTTG 
ATGTGGGGTA AAAATCAAGA TGCTGTTGAT GAATTAAATA CATGTCATAC AAATAAAAAG 
TATTTAAAAT ACGCGAAATT A 
(2) INFORMATION FOR SEQ ID NO: 359: 

(i) SEQUENCE CKARACTERISTICS: 

(A) LENGTH: 643 base pairs 

(B) TYPE: nucleic acid 
{C) STRANDEDNESS : double 
(D) TOPOLOGY: linear 



2400 

2460 

2520 

2580 

2640 

2700 

27S0 

2820 

2880 

2940 

3000 

3060 

3120 

3180 

3240 

330O 

3360 

3420 

3480 

3540 

3600 

3621 



SO 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 359: 
CTTTCGGAAA TTAGGATCnG nGCTATCTTG GCCCCAATTA CCAAGGGAAC TAnTGGCACC 



60 



55 
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AATGCtTCTT TCATCTCCAT GCCCTGTTGC TCATTATTAA TAACACGGTC TATTAACACA 180 

ATGGCATTTG TTACTACGAT TCCAATTAAC ATTAGCATAC CAATTAAACT TGGTACTGAT 240 

ATTGTTTCTC CTGTGATTAA TAGTGCAATA ATTACACCGA TAACTGTAAA TGGTAAAGAG 300 

AATAAAATTG TAAATGGTGC TAGGCCACCT TTAAATGTAA TAACTAGGAT TAAATATACG 360 

ATAATGATTG CAGCTAACAT TGCAAAGGCT AATTGTGTCA TTGCATTGTT AATATCATCT 420 

GATGCACCAC CGATATTAAC CTTTACATTA TTCGGTTTAT CCAAATTATT TATTTTAGAC 480 

ATCACTTGTC GTGTTGTGCC ACCCACATCT TTATTTGTTA CTTTAGCAGA TACCGTCGTT 540 

GCATAATCTC CTTGTTCTTG CGTCAATTTA CTTGGTGTCG TTGTTTTAAC TAACGTAGCG 600 

ATATCTCCCA ATTTAATCGT ACCACCAGTC GGCTTTTTCA AAG 643 
(2) INFORMATION FOR SEQ ID NO: 360: 

20 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2524 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

25 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 360: 

TTTCAGGCyG TGCAAGGGCT TTTTCTTTTG CTTTTAAGAT TATGATTTAT CGTGCAAAGT 60 

TAAGTGGTCG TATATAGTTT TAGTTTTAAA AAGGTAATTA AATAAAATAG TTTGCCGAGG 120 

GAGATGTCAA AATGATTAAA ATACCTAGAG GGAOGCAGGA TATTTTACCT GAAGATTCAA 180 

AGAAATGGCG TTACATTGAA AATCAATTAG ATGAATTAAT GACATTTTAT AATTATAAAG 240 

AAATAAGAAC ACCAATTTTT GAAAGTACAG ATCTTTTTGC AAGAGGTGTT GGTGATTCAA 300 

CCGATGTCGT ACAAAAAGAA ATGTATACAT TTAAAGATAA AGGCGATAGA AGTATTACAT 360 

40 TAAGACCTGA GGGAACAGCT GCAGTTGTGC GTTCATATAT TGAACATAAA ATGCAAGGTA 420 

ATCCAAACCA ACCAATTAAA CTTTATTACA ATGGACCGAT GTTTAGATAT GAACGTAAGC 480 

AAAAAGGACG CTATCGTCAA TTTAATCAAT TTGGTGTAGA AGCTATTGGT GCTGAAAATC 540 

CTAGCGTAGA TGCAGAAGTA TTAGCTATGG TTATGCATAT TTATCAATCA TTTGGATTAA 600 

AACATTTAAA GCTTGTTATT AATAGTGTAG GGGATATGGC GTCTCGAAAA GAATATAACG 660 

AAGCGTTAGT GAaACACTTT GAACCAGTAA TTCATGAATT TTGTTCAGAT TGTCAATCAC 720 

GTTTGCATAC AAATCCGATG CGAATTTTGG ATTGTAAAGT AGACCGTGAT AAAGAAGCGA 780 

TTAAGACTGC ACCTAGAATC ACTGATTTCT TAAATGAGGA ATCTAAGGCA TATTATGAAC 840 

55 



30 



35 



45 



SO 
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GTGGATTGGA TTATTATACA CATACAGCAT TTGAATTAAT GATGGATAAC CCTAACTATG 960 

ATGGTGcCAT TACAACGCTT TGTGGTGGTG GCCGTTATAA TGGTTTATTA GAATTGCTAG 1020 

ATGGTCCAAG TGAAACAGGT ATTGGTTTTG CGCTAAGTAT AGAACGATTA TTGCITGCAC 1080 

TTGAAGAAGA AGGTATCGAA TTAGATATTG AAGAAAACTT AGATTTATTC ATTGTTACAA 114 0 

TGGGTGATCA AGCAGATCGA TATGCTGTGA AGCTATTAAA TCATTTGAGA CATAATGGTA 1200 

TTAAAGCAGA TAAAGACTAT TTACAGCGTA AAATTAAAGG ACAAATGAAA CAAGCAGACC 1260 

GTTTAGGTGC CAAGTTTACA ATCGTTATTG GTGATCAAGA ATTAGAAAAT AATAAAATCG 1320 

ATGTTAAAAA TATGACAACT GGTGAATCTG AAACAATTGA ATTAGACGCA TTAGTCGAAT 1380 

ATTTTAAGAA GTAGAGAGGG CGTTAAAATA TGAGTAAGAG AACAACTTAT TGTGGATTAG 1440 

TTACTGAGGC ATTTTTAGGA CAAGAAATTA CATTAAAAGG ATGGGTTAAC AATCGTCGTG 1500 

20 ACCTTGGTGG ATtGATTTtC GTTGATTtAA GAGATAGAGA AGGAATTGTA CmAGTCGTGT X560 

TTAATCCTGC ATTTTCAGAA GAGGCaTTGA AAATTGCTGA AACAGTACGT TCTGAATATG 1620 

TTGTAGAAGT TCAAGGTACA GTTACGAAGC GTGACCcTGA AACAGTTAAT CCTAAAATTA 1680 

AAACTGGCCA AGTTGAAGTA CAAGTTACAA ATATTAAAGT GATTAATAAA TCTGAGACAC 1740 

CACCATTTTC TATAAATGAA GAAAATGTTA ACGTTGATGA AAATATTCGA TTAAAATACC 1800 

GTTATTTAGA TTTACGTCGT CAAGAGTTAG CGCAAACATT TAAAATGAGA CATCAAATTA 1860 

CACGTTCTAT TCGTCAATAT TTGGATGATG AAGGGTTCTT TGACATCGAA ACACCAGTAC 1920 

TAACGAAGTC AACACCTGAG GGTGCACGTG ACTATTTAGT ACCATCTCGT GTTCATGATG 1980 

GTGAATTTTA TGCATTACCA CAATCACCAC AATTATTTAA GCAATTATTG ATGATTAGTG 2040 

GATTTGACAA ATACTACCAA ATCGTAAAAT GCTTCCGTGA CGAAGATTTA CGTGCAGATC 2100 

GTCAACCTGA ATTTACACAA GTCGATATTG AAATGAGTTT TGTAGACCAA GAAGATGTGA 2160 

40 TGCAAATGGG TGAAGAAATG CTTAAAAAAG TTGTTAAAGA AGTTAAAGGC GTTGAAATTA 2220 

ATGGCGCTTT CCCACGCATG ACATATAAAG AAGCGATGCG TCGCTATGGT TCTGATAAAC 2230 

CAGATACACG TTTTGAAATG GAATTAATTG ACGTTTCTCA ATTAGGACGT GATATGGACT 2340 

TTAAAGTATT TAAAGATACT GTTGAAAATG ATGGTGAAAT TAAAGCAATT GTCGCTAAAG 24 00 

GTGCAGCTGa ACAATATACT CGTAAAGaTA tGGGaTGCTT TAACAGAATT TGTaAACaTC 2460 

ymXGGtGCTA AgGtTAGCGT GGGGTTAAAG TTGTGGGAAG GTGGTTTTGA CAAGGTCCCA 2 520 

SO 

ATGG 2524 
(2) INFORMATION FOR SEQ ID NO; 361: 

55 
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(A) LENGTH: 1507 base pairs 

(3) TYPE; nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: S51: 

TO TCGTTGAGTA AAAGTCCAGA AAATTGGATG AGTAAACTTG ATGATGGAAA ACATTTAACT 60 

GAGATTAATA TACCGGGTTC ACATGATAGT GGCTCATTCA CTTTAAAGGA TCCAGTAAAA 120 

TCAGTTTGGG CAAAGACTCA AGATAAAGAT TACCTTACCC AAATGAAGTC GGGAGTCAGG 180 

TTTTTTGATA TTAGAGGTAG AGCAAGTGCT GATAATATGA TTTCAGTTCA TCACGGCATG 240 

GTTTATTTGC ATCATGAATT AGGAAAATTT CTCGATGATG CTAAATATTA CTTGAGTGCT 300 

TATCCAAACG AAACAATTGT GATGTCTATG AAAAAGGACT ACGATAGCGA TTCTAAAGTT 360 

ACGAAGACAT TTGAAGAAaT TTTTAGAGAA TATTATTATA ATAACCCGCA ATATCAGAAT 420 

CTTTTTtACA CAGGAAGTAA TGCGAATCCT ACTTTAAAAG AAACGAAAGG TAAAATTGTC 480 

CTATTCAATA GAATGGGGGG TACGTACATA AAAAGTGGTT ATGGTGCTGA CACGTCAGGT 540 

AITCAATGGG CAGACAATGC GACATTTGAA ACGAAAATTA ATAATGGTAG CTTAAATTTA 600 

AAAGTACAAG ATGAGTATAA AGATTACTAT GATAAAAAAG TTGAAGCTGT TAAAAATTTA 660 

30 TTGGCTAAAG CTAAAACGGA TAGTAACAAA GACAATGTAT ATGTGAATTT CTTGAGTGTA 720 

GCGTCTGGAG GCAGCGCATT TAATAGTACT TATAACTATG CATCACATAT AAATCCTGAA 780 

ATTGCAAAAA CGATTAAAGC AAATGGGAAA GCTAGAACGG GTTGGCTGAT TGTTGACTAT 840 

GCAGGATATA CGTGGCCTGG ATATGATGaT ATCGTAAGTG AAATTATAGA TAGTAATAAA 900 

TAAGGATTCA ATAATGATAT TAAGACGAGT ATGAAAATAG TTAGATTCTA ATTATTTTCA 960 

CTACTCGTTT TTATTTTGAA AATAAGTAAT AATTCAACAA TATTATAAAT TGAACAGATT 1020 

GTTTGTGAAA TTTTTGATAA TATTAAAGTG AAAAAGTGTT ATAAATTGAT AAATATATGT 1080 

AATTAACAAA AACAAATCAT TTTAAAAAGA AGAGAGTTGT AAGATGATGa AACGATTAAA 1140 

CAAATTAGTG TTAGGCATTA TTTTTCTGTT TTTAGTCATT AGTATCACTG CTGGTTGTGG 1200 

CATAGGTAAA GAAGCGGAAG TTAAGAAAAG CTTTGAAAAA ACATTGAGTA TGTACCCTAT 1250 

TAAAAATCTA GAGGATTTAT ACGATAAGGA AGGCTATCGT GATGATCAGT TTGATAAAAA 1320 

SO TGATAAAGGT ACATGGATTA TAAATTCTGA AATGGTTATT CAACCTAATA ATGAAGATAT 1380 

GGTAGCTAAA GGCATGGTTC TATATATGAA TAGAAATACC AAAACAACAA ATGGTTACTA 1440 

nTATGTCGAT GTGACTAAGG ACGAGGATGA AGGAAAACCG CACGACAATG AAAAAAGATA 1500 

55 
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(2) INFORMATION FOR SEQ ID NO: 362: 

(i) SEQUENCE CHARACTERISTICS; 

(A) LENGTH: 1216 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNSSS : double 

(D) TOPOLOGY: linear 



10 

- (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 3S2: 





TACATGTTTC 


GGATGCTACT 


TTATTTAGTT TGAAGGGTGC ATTATGGACG 


TTAGCGCAAG 


60 


10 


AAGTTTATCA AGAATGGTAT 


TTAGGATCGA AGTTGTATGA AGATGTTGAA AAGAAAATAG 


120 




CACGAACTAC 


TTTTAAGACA 


GGTTATATTT ATCAAGAAAT TATTTTGAGA 


CCAGTAGATG 


180 




AAGTTAAGGT 


ACTTCTGAAT 


GATTTAAAAG GTGCTGGTTT CGAATTAGGT 


ATTGCAACAG 


240 


20 


GTCGTCCTTA 


TACTGAGACT 


GTTGTGCCAT TTGAAAATTT AGGATTGTTA 


CCATATTTTG 


300 




AAGCTGATTT 


TATTGCAACA 


GCAAGTGATG TTTTAGAAGC AGAGAATATG 


TATCCGCAAG 


360 




CACGACCATT 


AGGAAAGCCG 


AATCCTTTTA GTTATATCGC AGCTTTATAT 


GGTAATAATC 


420 


25 


GCGATAAATA 


TGAATCTTAT 


ATCAATAAGC AAGATAACAT TGTAAATAAA 


GATGACGTAT 


430 




TTATAGTAGG 


CGATTCGTTA 


GCTGACTTAT TAAGTGCTCA AAAAATAGGT 


GCAACGTTTA 


540 


30 


TTGGAACATT 


AACAGGTTTA 


AAAGGTAAGG ATGCTGCAGG TGAGTTAGAA 


GCGCATCATG 


600 


CCGACTATGT 


TATTAATCAT 


TTAGGTGAAC TTAGAGGTGT ACTAGATAAT 


TTGTAATTTG 


660 




ATTGTTGTTT 


GACAGCATAA CTTGTAGTGA ATGATTGAAC CAAAGGTTTC 


ATATTGAGTT 


720 


^35 


ACAATGAAAT 


TAATAATGAA 


AAAATGCCAA GAAGCAATGG AAGTAATCCA ATGTCTTCTT 


780 




GGCATTTTGA 


ATTTACATAA 


ATTGTTTATG ACTGTACCGT CAATTCAGTT 


GTGAAAATTT 


840 




GATTGTATTC 


ACCAACTTGT 


TTAAGTTCAT CAATTATATT GTTTGAAACA 


GGTTGATCAA 


900 


40 


CGGATAAAAT 


CATTAGCGCA 


TCTCCGCCCG CTTCAGTTCT ACCTAAAGTC 


ATAGATGCAA 


960 




TGTTGATATT 


GTATTTACCT 


AACAATGCX5C CAGTTTTTCC TACCATACCT GGAGTATCAT 


1020 




TATGATATGA 


CACAATTTGA TATTGATTTG GCTTTAAGTC TACAGAAAAA TTATTAATTC 


1080 


45 


TAACAATTCT 


TGGACCGAAA 


CCTGTAAAGA CAGAAGCGCC AACFITAACG 


GAATCGCnAT 


1140 




CGnTTGATAG 


TTCTACCTCT 


AAGTAGTTAC TAAAACCTGT CTCTGCTTTA 


TTATTTTCAA 


1200 


SO 


TATTTAATGT 


CACTTG 






1216 


(2) INFORMATION FOR SEQ ID NO: 363: 







(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 867 base pairs 

55 
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(C) STRANDEDNESS : double 
ID) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 363: 

ATCAAAATAT TTTAAATAAT ATTGATGGTC ACATTGTAAA TrmAATAGAA AATAAATTTG 60 

10 ATCAAATATT ACAAGAACCA TTAAATCCAT TAAATTATGA TACTGTCAGT GGATTAGCTG 120 

GGATAGGGAG ATATTTGCTA AATAGAGTAG ATGAGAATGA ATTTAATGTT AAAGCATTAA 180 

AAAGCATATT AGTATACTTT AAAGATATTC AATATTCTAA AAATAGCTGG GTAGTCCCAC 240 

AAGArAGTCA ATTTTTAGAG TCTGATAAAA ATTATTTTAC TGAAGGTAAT ATCAATCTTG 300 

GCCTTGCACA TGGaGTGCTA GGACCGATGT CTTTATTTGC ATTATGCGTG ATTAAAGGAA 360 

TTACGATTGA AAATCATCAG CACATATTAA AAGACATGTA CAAATTTATC ATGGACGAAA 420 

AATTTTGTAA CCACGAAAGA TGGTTGCAGC GTTACGATTT AATTTCTGAA CGTAATCATT 480 

TCAATTTTAT TCGGAATGGT TGGTGTTATG GCAATACGGG TGTAATGACG ACGTTGTTTT 54 0 

TAATCGGCCA AGCATTACAA GATGATGAAA TAATTAAAAT GTCTAAAAAA GTGATGCTAC 600 

AAGTAGTAAA TGATAAAGAT GAAAATTTAA TAAGTCCAAC TATTTGTCAT GGATTGTCAT 660 

CACAAATATT AATGTTAACA ATTATGAATT TGAATTTTGA ATTAAATGAA GTGTCTGATT 720 

ATATCACTGT ATTAATAAAT AAACTGATTT CTCATTATAA GGAAGATTAT CTGGTGAATT 780 

TTATAGACAT TAATGAAAAT AAGCAAGATG TATTTAAAAG TAGGAAAGTT GGCCTTTTAG 84 0 

AAGGTGAATT AGGGGTCATC TAACATT 867 
(2) INFORMATION FOR SEQ ID NO: 364: 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 10813 base pairs 

(B) TYPE: nucleic acid 

40 (C) STRANDEDNESS: doiible 

(D) TOPOLOGY: linear 



{xi) SEQUENCE DESCRIPTION: SEQ ID NO: 364: 



SO 



TACCTTTTCT 


TtTAAATCAT 


TTTATATTTT 


CCCaCTAATA 


TCCGcTGtTA 


ATCaATCCtG 


60 


ACATCCtTGT 


ATCaCTATGA 


CAATTAATTG 


TTAAATACAT 


GAATTTCTAC 


ATTTTATGAA 


120 


AAAATCCATT 


TTTATTACAA 


TTCAACACTT 


TATATGACAA 


CTTCATTACA 


GTTACTTTTA 


180 


TTGTTGATTG 


CTTACATTGT 


TTTCTAAAAA 


AAATTTGTTA 


TCATAATTAA 


CGTTGAATAA 


240 


AGAAAAAAAT 


TAACTTGGGA 


GATAAAAATG 


GAATATAAAA 


AGATACTAAT 


TCGTTTATTA 


300 
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CAATCGCATG CCGCAGTTAA TTATTATAGT AAAAACCAAT GTACATGOTG GGCATTTAAA 420 

CGTCGCGCAC AAGTCGGTAA ACCTGTTTCT AATAGATGGG GCAATGCTAA AAATTGGTAT 4 80 

^ TACAATGCAC GTAAATCAAA ATATGCGACT GGTCGTACAC CAAGAAAATT TGCTGTCATG 540 

CAATCAACTG CAGGATATTA TGGACATGTC GCAGTTGTTG AACAAGTATA TAAAAACGGT 600 

AGTATTAAAG TTTCAGAATA CAACTTTTAT CGCCCATTAA AATACAATAC ACGTGTACTA 660 

10 

AGCAAAAAGG CAGCACGTAA CTTTAACTAT ATTTACTAAT CAAAAAACTT CTATCACGAA 720 

CGCTTCAATT TCCTGTATGC GTGTGATAGA AGTTTTTATT TTATGAAATT ATATTATTAC 780 

TTCTACAAAT TTCAAATTGC CGTAATTGAA CGTATATTTC TTCTTCAACT ATTATTTCAT 840 

15 

CTTTAGCATA ATCTATATAT AAAATTTTAT GCTATTATTT AAATAATTCG CTATAACTTA 900 

ACATACGTTT TCGATATAAA CCTTGTTCTA AATCTCAATA ATTTTTTGCT GTTTTCATCG 960 

20 TCATTAGTTA AAAAAATAAT TTAACTGAGT TTTTGAGACC TGTTTAAATT GATGACTCAA 1020 

AACCTTTATC CCCTTTTCAC TCGGTTTAAT TGCTTTAATA TTTAACACAG TCTCATTGTA 1080 

ATTTTGCTAC TAAGTTTGAA ATATTTCGAT TCGAATGTGA AcATCATTTA TTATTACTTT 1140 

CGACAGCTAG AAAAATATTG TTAAACCAAA ACTATAATTA CCACTTTTAT ATAGAACTAT 12 00 

ATATAAATTT TAACTTTGAG ACAGAACTGC TAGTCAGGTT TATGAATATA TTTCTTTAGT 1260 

TTACTTGaTA TACTTATTGG TAAATCATTA TTTATTTGAA GAGCATTTAT AACAAAAAGT 1320 

30 

ATAATCCCAG TTATAGCGAT TCCATGACCA TTTTTATCAG TCAAAGATTC ATCAACAAAA 1380 

ACTTTTTGAT AAATTTATAT ATTTGTATAA TTTATTATGG TAGATATCTA CACCCGTATC 1440 

TATAACAGCT ACAGTTATCA TTGCX5TCTTA TCCAAATAGT TTTTAAGAAA TAAATATAAT 1500 

35 

TCATTAATAT CATGGCTATT TGTAACGTCA GtGCTTaAGA CCTTGTCAAT TATTGTTTTA -1560 

TCTGTTTCTA AGAGCCCCTG ATTTTCTGCA TACATATTTT GTATATCGCT GTTAATCTCA 1620 

TTTAATTTTT TAAATTTTTT TCTAACCTTT TTCAAAATAA AATGCTCTTT AATTCCATCT 1680 

CTTAAATACA TATAAATCTC TATTATAATC TCCATAAATG TCATATCTCC TCTCTCAAAA 1740 

AACATTATAC TCAATATATT AAAAATAAGA AAGGTTTTrX CAGAATTTrT AGTATTTTCA 1800 

45 GATATTTATT CTTAAGTATC TTATTATTAC TTCTTTTTAA CGCTAGTGGa ATAATTAATA 1860 

ATAATTGTAT TTAAATGCAA. TGCTGTTGTT CTTTCATACT TACAAGCAAG TCATAAGAAA 1920 

TGAGAAATTA AATTCTTATA TGATGAATAA ATGATGACTG CAGAAGAAAT TGCTAAAAAA 1980 

GGAGTGGAGT GAGGCATTCT ACTGTTCATA TTGTTAACAA ATATCAAAAT GATAGGAACT 2040 

TGAAGAATCT AAGACTGTTA AAATCGAGAC AAGAAGAAAC TCGTTCCAAA TTTGAATCCT 2100 
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AAAACTTCTA TCACGAACGC TTCAATTTCC TGTATGCGTG TGATAGAAGT TTTTATTTTT 2220 

GTTCATATTA ATTTATCTAA GCGCTACGAT GGaCTGACTT AAACTTTTCT TTAAAATCGC 2280 

5 

TAT7CGCCAT TTACTATTGT TGTCTAATTT CTTGTAAAAT ATGTTCCGCT GCTTGTGTAT 2340 

TTGCACGGGG TTCTTTTTTC AAAGCTTCAG CTACTTTAGC AATTTCATCA CCTTTTGCCC 2400 

CTACAACGAT AGCTAATGAT TTATATTGTA AACTCATATG ACCTTGTTGA ATACCTTCTG 2460 

10 

ACACAAGCGC GCGACATGCT GCAAAGTTTT GCGCTAAACC AACGGCAGCA ACTACATGAC 2520 

CTAATTCTTG TGCTGACTCT ACATTTAGTA GCTCTAATGA AGCTTTAGCA ATTGGTAATA 2580 

^5 CTTTTGTACC ACCGCCAACG ATTGCCAATG TCATAGGCAC TTGAATTGTA CCAATCAATC 2640 

GTTGACGATC TTGATCGTAA CGCCATGTAG CAATACCACG ATACTGTCCG TCACGACTCG 2700 

CGTATGCATG CGCACTTGCT TCTGCACCAC GCGTATCATT TCCTGTTGCT AAAACAACAG 2760 

20 CATGTATGCC ATTCATAACA CCTTTATTAT GTGTTGCTGC ACGATGAATA TCTACTTGGG 2320 

CCAATACAGA AGCACGTTCC ATTCGTTTGG CAACCTCTTC TCCAGTTCTC TCGCCCCTTG 2880 

CTAAATCTTT AACATCAATT TCGCCTTGAA CTTTAACAAC GGACGCTGTT GCATGATTGG 2940 

ATAAAATACT CATTAAAATG TCGCTTTGCG GAAATTCATT TTTTAAAAAT GCAGTTATGG 3000 

CCTCTAAAAT CGTATTAAGC ATATTAGCGC CCATAGCATC TTTCGTATCA ACAAATACTT 3060 

TTAAAGATAG TAACTGTTGC TCAGGAAATG TATCAATCGC TATACGTTGG TAACCACCAC 3120 

30 

CACGCGCTTT AATAGAAGGA TATGCCTCAT CCGCAATTTT ATGAATTTGC TTTTCTAAAG 3180 

CTTTAATGTC TGCTGATAAT TTTTCAGTAT CGTCAACGCC ATCAAAGACG ATTTGACCTA 324 0 

TCATAATACG TTCAGAAGAT ACCGTTTTAA ATCCGCCAGT CTGATTCACT AGCTTTGCAC 3300 

35 

CATAACTAGC TGCAGCGACA ACTGAAGGCT CTTCCACCAT CATAGGTACA ACATATGCCT 3360 

TATCGTCCAC AATGATATTC GGTAATAATC CAACGGGTAA TGCACCTTGC GCGATGACAT 3420 

40 TTTCAATTAA ACTATTGGCT ACTTCTTCAT CGATTAATGG ATGATTCAGT AAAATGTCGA 3430 

ATTGTTCrrC TGATAACCAT TGCTTATCAA CCAATTGTTG TAACTTTTCT TTACGAGATA 3540 

AATGTCGAAA ATTCTTATCT AAATTTTGCA TGGACGTACT CCTTTTACTT CACATAATTT 3600 

TTAACATTTC AATCACTACT ATTTTTACCA CAAAATAACG TCATTCGTCT TAAAATTCAA 3660 

TTGAATAATT GTCGTTTTGA CTTTAAAATA AAACAAGGTA AATTAAAACG CTTACAAGAA 3720 

ACGACAAATC ATTTTTAAAT TTAGTATATT TCTTTGTATA AAATTAGCAT ATTCTGATAT 3780 

SO 

GATACAAGTG TTGCTTTTAT AAATTTGAAA GGATGTAAAA CCTTATGACA ATAGGTATCG 3840 

ATAAAATAAA CTTTTACGTT CCAAAGTACT ATGTAGACAT GGCTAAATTA GCAGAAGCAC 3900 
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10 



25 



CTGTAAACCA AGACATCGTT TCAATGGGCG CTAACGCTGC TAAGGACATT ATAACAGACG 4020 

AAGACAAAAA GAAAATTGGT ATGGTAATTG TGGCAACTGA ATCAGCAGTT GATGCTGCTA 4030 

AAGCAGCCGC TGTTCAAATT CACAACTTAT TAGGTATTCA ACCTTTTGCA CGCTGCTTTG 4140 

AAATGAAAGA AGCTTGTTAT GCTGCAACAC CAGCAATTCA ATTAGCTAAA GATTATTTAG 4200 

CAACTAGACC GAATGAAAAA GTATTAGTTA TTGCTACAGA TACAGCACGT TATGGATTGA 4260 

ATTCAGGCGG CGAGCCAACA CAAGGTGcTG GCGCAGTTGC GATGGTTATT GCACATAATC 4320 

CAAGCATTTT GGCATTAAAT GAAGATGCTG TTGCTTACAC TGAAGACGTT TATGATTTCT 4380 

75 GGCGTCCAAC TGGACATAAA TATCCATTAG TTGATGGTGC ATTATCTAAA GATGCTTATA 4440 

TCCGCTCATT CCAACAAAGC TGGAATGAAT ACGCAAAACG TCAAGGTAAG TCGCTAGCTG 4500 

ACTTCGCATC TCTATGCTTC CATGTTCCAT TTACAAAAAT GGGTAAAAAG GCATTAGAGT 4560 

^0 CAATCATTGA TAACGCTGAT GAAACAACTC AAGAGCGTTT ACGTTCAGGA TATGAAGATG 4620 

CTGTAGATTA TAACCGTTAT GTCGGTAATA TTTATACTGG ATCATTATAT TTAAGCCTAA 4680 

TATCATTACT TGAAAATCGA GATTTACAAG CTGGTGAAAC AATCGGTTTA TTCAGTTATG 474 0 

GCTCAGGTTC AGTTGGTGAA TTTTATAGTG CGACATTAGT TGAAGGCTAC AAAGATCATT 4800 

TAGATCAAGC TGGACATAAA GCATTATTAA ATAACCGTAC TGAAGTATCT GTTGATGCAT 4860 

ATGAAACATT CTTCAAACGT TTTGATGACG TTGAATTTGA CGAAGAACAA GATGCTGTTC 4920 

ATGAAGATCG TCATATTTTC TACTTATCAA ATATTGAAAA TAACGTTCGT GAATATCACA 4980 

GACCAGAGTA GTCGGTGTAT TTAAAACACA TATAATAAAA CCTAAAAGCA GCAGTAAGAC 5040 

CACTTCTAAT TGAAATCGTC TTACTGCTGT TCTCTATTTA TAACACTTCG TATTGAATGA 5100 

ATTCATTATG CCTATTTGAC ACATTATTGA AGTTTTCCTA ATGCCTGGAT CCTTTATACG 5160 

TTACGGCTTC GTGCTATGTT TTGGTACATA AAGCTTTGAC ATATCGATAT TCTCCAACTC 5220 

40 TAACAGCTTA ATTTTATTAT TAATCGTTCC ACCGAACCCT GTTAAGCTAC CCGTTTTACC 5280 

GACAACACGA TGACATGGCA CGATAATAGA TAATGGATTA CTTCCGACTG CACCTCCAAC 5340 

CGCTTGGGCT GACATTTTTG GCTTGTTAAG CAGCTTGCCT ACTTTTTTGG CAATAGCACC 5400 

ATACGTTGTT AGAGTCCCAT AAGGAACCTG TCTTAATTCA TTCCAAACAC ACTGTTGAAA 5460 

ATGACTACCT GTTGGCTTTA AAGGTATTGT GATTTCAGGA TTGTCACCTT TAAAATACGC 5520 

GTCTAACCAC TGTGTCGCCT CTCTAAATAT CGCTAAAGAC GTATTTTCTT CCCTAGTACC 5580 

ATCACCTTGT TGATTTTCAA ACAAAACAGC GGTCAGACTT ACCCCATCAC TCAAAAGTTC 564 0 

CAATCGTCCT ACAGGCGAAT CATAGTAACT CTTATACTCC ATAAAAATTC CCCCTTTTTC 5700 
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ATAA.GTCGTC 


AATTACGTAT 


ATAAACACGT 


AATACCAGCT 


ATCACTTTGC 


TGCAATATAC 


5820 




AGTTACATAT 


CTTACTACAC 


GTGCTAACCT 


CTTACTTTGT 


AAACCAAATC 


TTAAATTAAA 


5880 


5 


ATATTGAAAA 


TGCAATGAAT 


CCTTAATATT 


TTATTAAAC C 


TATAATTACT 


TATTAAAAAT 


5940 






ATTCATAAAG 


TTTTAAAAAT 


ATTCTGTTTT 


ATCACCTACT 


ATTAGTGGAA 


6000 


10 




GrAATTGTAT 


ATAGTTTGCA 


TAACGCTTCA 


AAAGTAATTT 


CTTTTTTGTT 


6060 






a a aTTTaf^ af^ 


GTGATGTTAT 


ATGAATAACG 


GTTTTTTCAA 


TAGCGACriT 


6120 




GATTCAfti 1 1 




GATGAAAGAT 


ATGCAAGGTT 


CAAATCAAGT 


CGGAAACAAA 


6180 

w \J V/ 


- 

15 


AAGT AuT A i A 


^*T^ TV TV ^^/i' T' a a 


AGAAGTTTCA 


CCTGAAGAAC 


TAGCGCAACT 


CACACAACAA 


6240 




GGTviTGCAArv.. 


a r^r'T/'^^fia. 

Aw i U 1 WV» X 


ACAAAGTGCG CAAgcTTTTC AACAAGCAGC ACAAAGACAA 


6300 




CAACAjGCAAC 


a ar'/^Tvi/^r'a a 


CGGCAATTAT 


TTAGAACAAA 


TTGGTCGTAA 


CCTTACGCAA 


6360 


20 


GAAGCACGTU 


TV ^^rV ^'l*!'*!' i ^P^P 

AL^G^l 1 lAI 1. 


AGATCCAGTC 


ATTGGTCGTG 


ATAAAGAAAT 


TCAAGAAACT 


6420 




GCTGAAGTTT 


i AAV9 X Ao Awvj 


AACTAAAAAC 


AATCCTATAT 


TAGTTGGAGA 


AGCTGGTGTT 


6480 




GGTAAAACTG 


LoAX iGX iVoA 


AGGTTTAGCA 


CAGGCAATCG 


TTGAAGGAAA 


TGTACCAGCA 


6540 


25 


GCAATCAAAG 


Av_AAAGAAAX 


TATTTCTGTA 


GACATTTCAT 


CATTAGAAGC 


TGGAACGCAA 


5600 




lAlLGlGGivj 


^ X X X 1 wvSOiA. 


AAATATTCAA 


AAATTAATCG 


AAGGTGTTAA 


ATCTTCACAA 


6660 


30 


AA i\jrUuG 1 Av.* 


XAX XV.. X X Xk^A 


TGAAATCCAT 


CAAAITATCG 


GTTCAGGTGC 


CACAGGAAGT 


6720 


TV T"TT' ?v rr^T jv 
GAl iUAGGlA 


/*■ a a a t^fzn 


ATCTGATATT 


TTGAAACCTG 


CATTAAGTCG 


TGGTGAGATT 


6780 




IdAi lAXio 


rsT/^r" a. a 2x A f 


ACAAGATGAA 


TATCGAAACA 


ATATTCTTAA 


AGATGCTGCA 


6840 


35 


1 1 AA^VtJvJvjW^ 


^1 a TTTa JiTfl A 
VjnX X X^w%Xv9A 


AGTGCTTGTT 


AATGAACCAA 


GCGCTAAAGA 


TACTGTTGAA 


6900 




a TT'TT a a a li 
/ii X i iMAA/ivj 




AAAATTCGAA 


GAACACCATC 


AAGTAAAATT 


ACCAGATGAC 


6960 




<^ T a. T*r zv a. a a r* 


S^iAXvjXVjX Xw/a 


CTTATCAATT 


CAATATATTC 


CACAACGATT 


ATTACCAGAT 


7020 


40 


a a a rr* a a Tr'^z 


»v TVITGTT A 
^ .A O X 1 X /%vjrt 


TATTACAGCA 


GCACA'rri'AT 


CTGCGCAAAG 


TCCAGCTGTC 


7080 






AAAPTGaAAA 


ACGAATTTCT 


GAATTAGAAA 


ATGATAAACG 


TAAAGCAGTA 


7140 






AATATAAAAA 


AGCTGACGAC ATTCAAAATG AAATCAAATC ATTACAAGAT 


7200 


45 


AAATTAGAAA 


ATAGTAATGG 


7GAACATACT 


GCTGTTGCTA 


CAGTTCATGA 


TATTTCAGAT 


7260 




ACTATTCAAC 


GATTAACTGG 


TATTCCAGTT 


TCTCAAATGG 


ATGATAACGA 


TATTGAACGT 


7320 




TTAAAAAATA 


TTTCTAATCG 


TTTAAGAAGT 


AAAATC^TAG 


GTCAAGATCA AGCTGTAGAA 


7330 


SO 


ATGGTTTCAC 


GTGCAATTCG 


CCGTAATCGT 


GCTGGGTTTG 


ATGACGGCAA 


CCGTCCAATT 


7440 




GGCAGTTTCC 


TATTTGTTGG 


CCCTACTGGT 


GTTGGTAAAA 


CAGAGCTTGC 


TAAACAATTA 


7500 
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GACACAACAG CTGTTTCAAA AATGATTGGT ACAACTGCTG GTTATGTTGG TTATGATGAC 7620 

AATTCAAATA CGTTAACTGA AAAAGTACGC CGTAATCCAT ACTCAGTCAT TCTATTTGAT 7680 

5 

GAAATCGAAA AAGCAAATCC ACAAATTTTA ACATTGTTAT TACAAGTAAT GGATGATGGT 7740 

AATTTGACTG ATGGTCAAGG TAATGTCATC AACTTTAAAA ATACAATTAT TATTTGTACA 7800 

TCAAATGCTG GCTTTGGCAA TGGCAATGAC GCTGAAGAAA AAGATATTAT GCACGAAATG 7860 

10 

AAAAAATTCT TCCGCCCTGA ATTCCTTAAC CGCTTCAACG GCA7CGTTGA ATTCTTACAT 7920 

TTAGATAAAG ATGCATTGCA AGATATCGTC AACTTATTAT TAGACGATGT ACAAGTTACA 7980 

TTAGACAAAA AAGGTATTAC GATGGACGTT TCTCAAGATG CGAAAGATTG GTTAATTGAA 8040 

GAAGGCTATG ATGAAGAATT AGGTGCACGT CCATTAAGAC GTATTGTTGA ACAGCAAGTA 8100 

CGTGACAAAA TTACAGATTA CTATTTAGAT CATACAGACG TTAAACATGT GGATATAGAT 8160 

20 GTTGAGGATA ACGAATTAGT CGTAAAAGGT AAATAACGAC ACTTTAACAT ATCGCGCATC 8220 

AAAAATGAGC ATCAGGTCGC CCTTGCCTGT GCTCATTTTT TTAATTATTT CCCTGGAAAA 8280 

TGATTCGCTG TGTGCTGTTC TGTTCCACAA CAATCACGAT TAATGTCACA TGTACCACAT 8340 

25 TTTCCTTGTT TTGAACGCTT GAAAAATTTT ACTAGT6TAT ATAAGGCATA TCCGAAAATT 84 OO 

GCTAAAAAAA TTAAAATGTT AATAATGACT GACACTTTAA CCACTCCTTA AACAAATAAA 8460 

TGTCCGACTT GATAAAAAAT GAATGTTAAG ACATATGCAG TGACTAGAGG ATAGGCAACT 8520 

30 

GCAAGTGCCG TCCATTTCCA TGAATAAGTC TCTTTACGGA TTGCTGCTAC TGTAGAAACA 8580 

CAAGGAATAT ACAATAGTAT AAATATCATA AATGCATACG CAGATAGCGG TGTGAATTGA 8640 

TTTTGAATCA CATTAACAAG GCCTGCATCA CCTGATGAAT AGATAATCGC CATCGAACTT 8700 

35 

ACGATAACTT CTTTTGCTAA AAATCCTGGC AcTAACGTAG CACCTGCTTG CCATGTTCCA 8760 

AATCCGAGCG GTTGCACTAA CATACCAAAG AAACTACCAA CCATATGTAA AAAACTTTGA 8820 

TTGATATTCA CATTGATACC ATGTGGTCCT ACATAACTTA ATAGCCAAAT GACTACTGAG 8880 

40 

CCGCCAAAAA TAAATGTACC TGCTTTACGA ACAAAGCCCT TAGCCTTTTC CCAAGTACTA 894 0 

CGCCACAACG TTTTAATGGA AGGCACACGG TATGTTGGCA ATTCCACAAT AAAGATTGCA 9000 

45 TTATCATTTT TTAAAATCGT CTTAGTAAGT ACTGTACTGA CTAAAAATGC CATAATAATA 9060 

CCTAAAACAT ACAGGCTTAA TACTACTAAA GATTGATTCT CTTTGAAAAA GATACCTACG 9120 

AACAACGCAT ACACTGGCAG TCTAGCAGAG CATGACATGA ATGGTGCAAT TAATATCGTT 9180 

GTTAAACGCT CTTTTTCATT TTCAATACTG CGCGCAGCCA TAATACTCGG TACATTACAA 924 0 

CCAAATCCGA TAATCATTGG TATAAAAGAC TTCCCGCTTA AACCGAACGA TTCCATAATA 9300 
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AAAAAGAGCA CAACAATTTG TGGTACAAAG ACTAATACTG ATCCTACACC AGCAATAATG 9420 

CCATCTGTAA TTAAATCTTG TAAAAATGGT ATAACACCAA GATAATTCAT AATCGTCTTC 9480 

^ ACACTATCTG TAAATGTACC ACCTATAAAT GCATCGAGTT GATCCGACAA AGGTGTGCCA 9540 

ATCCATGTAA ATGTAGTTTG AAAGATCAAC CACATAATTG CTAGAAAGAT AGGCATCCCT 9600 

ATATATTTAT GTGTTAATAT CTTGTCTATT CTAGAGCTGA AATATTGCTT ATCTTCATCT 9660 

10 

GGATACGTTA CCACGTCTTG CAATAACGTC TCAATATAAT GATTGCG7AT ACGCTCCATC 9720 

TCrCGACGAA CAGATACAGC CCCTACTTGT TCAGCAACTT GATCACGTAA ACTCGACAAT 9780 

TTATTTACAA CCTCTGAATT AAGTTCGTTT GCAATTTGCA TGTTATTTAA TAAGAATTGA 9840 

IS 

ATCGCAATAA ACCTAGCTTG ATACTTATCA TGAGATGTCT CTGTCATTAT TATTTGACAC 9900 

ATATTTTTAA TTGTCTCTTC AATCTTCTCA CCATAATTGA TTTTAAAATG CGGTTGATAC 9960 

2^ CCTTCCCCTA GATGCTTTAT TTCGCCAAGT AAATATTTTG TTCCTTTGCC TGTACGTGCC 10020 

ACAACTGGAA AAATAGGTGT TTTTAACTTT TTCATCAATT TATGATAATC GATTTTTATC 10080 

CCGCGCTTTG TAGCTACATC AATCATATTT AATCCGATGT ATATTGGTTG ATTAAGTTCT 10140 

25 AACAATTGTA CTGTTAATTG CATATTTCTT TTTAGTTGAC TCGCATCAAC AATGTTAATG 10200 

ATTCCTGAAA ATGAATCGTT TAATAAATAG TCTGTCACTA CAGTTTCATC TTTAGAAATC 10260 

GGCGATAAAT CATATGTACC TGGTAAATCA ATTAATTGTC CTACATTTTC TTTAAGTTTC 10320 

CCTACTTTTT TCTCTACCGT TACGCCACTC CAGTTGCCTA TATATTCATA CGAACCAGTT 10380 

AAAGCGTTAA ACAAAGATGT TTTACCAACA TTAGGATTTC CTAAAATACA ATAATTTTCC 10440 

ATTCGTCCGG CTCCTATTCT TCTAATGCAA TAGAACAAGC ATCGCAATGT CTAATACTTA 10500 

35 

ACTGTTGTCC GTTTACTTCA ATAATACATG GCCCTTTAAA TAAACATTTT TGTTTAATCG 10560 

TTATGATAGC GTCATCTGTT AACCCAAAGG CACTTAGACG ATACAACATA TTCTCATTAG 10620 

CAATATCCAT TCGCTTTATT TTATAAGCCT TATTCATTTC ACCATTTTTA ATGTTTAACA 10680 

40 

TACTATTTCG CTCTCCTATT AGAAATAATA ATCATTATCA CTTAAAAATC ATAACCCTTA 1074 0 

AAATTGTAGC TCGCAATACT TTATTXAAAT AATTTTCATT TTTCATGTAA AATTTGTGAC 10800 

45 ATTGCAAAAA TGT 10813 

(2) INFORMATION FOR SEQ ID NO: 365: 

(i) SEQUENCE CHARACTERISTICS: 

CA) LENGTH: 6804 base pairs 
so (B) TYPE: nuclexc acid 

(C) STRANDSDNESS : double 

(D) TOPOLOGY: linear' 

£5 
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(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 365: 





TGATGGATTA 


GCAGACATTT 


TACGAGCGAA 


TGGTTTCAAA 


GTGTTTGGTC 


CAAATAAGCA 


60 


5 


AGCAGCTCAA 


ATCGAAGGCT 


CAAAATTATT 


TGCTAAAAAG 


ATAATGGAAA 


AATATAATAT 


120 




TCCAACTGCT 


GATTATAAAG 


AAGTTGAGCG 


AAAAAAGGAT 


GCTTTAACAT 


ATATTGAAAA 


180 


10 


CTGTGAATTG 


CCCGTTGTTG 


TCAAGAAAGA 


TGGGTTAGCT 


GCTGGGAAAG 


GCGTTATTAT 


240 


TGCAGATACT 


ATTGAAGCAG 


CCAGAAGTGC 


TATTGAGATT 


ATGTATGGTG 


ATGAAGAAGA 


300 




AGGTACTGTT 


GTATT7GAAA 


CGTTTTTAGA 


AGGTGAAGAG 


TTCTCGCTAA 


TGACATTTGT 


360 


IS 


TAATGGTGAT 


TTAGCAGTAC 


CTTTCGACTG 


TATTGCACAA 


GATCATAAAC 


GCGCATTTGA 


420 




TCATGATGAA 


GGACCAAATA 


CTGGTGGTAT 


GGGGGCTTAT 


TGTCCmgTAC 


CACATATTAG 


480 




TGACGATGTT 


TTAAmACTTA 


CAAATGAAAC 


AATTGCACAw 


CCCATTGCAA 


AGGCAATGCT 


540 


20 


TAATGAAGGT 


TATCAATTCT 


TCGGTGTATT 


ATACATTGGT 


GCTATTTTAA 


CTAAAGATGG 


600 




TCCAAAAGTA 


ATAGAATTTA 


ATGCCCGTTT 


TGGTGATCCT 


GAAGCTCAAG 


TATTATTAAG 


660 




TCGCATGGAA 


AGTGATTTAA 


TGCAGCATAT TATTGATTTA GATGAAGGAA AACGTACTGA 


720 


2S 


ATTCAAATGG 


AAAAATGAAT 


CTATTGTAGG 


GGTCATGTTG 


GCATCAAAAG 


GATATCCTGA 


780 




TGCATATGAA 


AAAGGGCATA 


AAGTAAGTGG 


CTTTGATTTA 


AATGAAAACT 


ATTTTGTTAG 


840 




TGGATTAAAG 


AAGCAAGGTG 


ATACCTTTGT 


TACTTcAGGT 


GGTAGAGTTA 


TACTTGCCAT 


900 


30 


CGGAAAAGGT 


GACAATGTAC 


AAGATGCACA 


GCGAGACGCA 


TACAAAAAAG 


TATCACAAAT 


960 




ACAAAGTGAC 


CATTTATTCT 


ATCGTCATGA 


CATTGCGAAT 


AAAGCACTAC 


AACTTAAATA 


1020 


35 


AGTAAATTTA 


AAATACTAAG 


aTTAGCTATG 


AACGAATCTA 


TAACGATAGA 


TTTTTTCATA 


1080 


GCTTTTTTAG 


TTGTAGAGTC 


TAGGACATTG 


ATTTCTGTAC 


CAAATTTGTG 


ATTATGCATA 


1140 




TGTAATACAA 


AAGAGGCGCC 


ACAACATGTT 


TGGATGAACA 


AAATAACATG 


TTTGTGGCAC 


1200 


40 


CTCTTTTGTT 


TAGTATGGAA 


TAAATGGTTT 


TCTTTTTCTA 


TACAATGAAT 


TTCTAATTTA 


1260 




GTATCTATAC 


AATTATGGAT 


AAAATTTAAC 


CTACACGACC 


AAGACGAACA 


TCATCTATGC 


1320 




CCGTGATGGG 


TAAGGTGATT 


GAACAATAAT 


ATGCCATAGT 


AATAATGGCA ATTAAAACTA 




45 


TAATAAAGAT 


TATATCTTTA 


TATGAGAAAG 


GTACGTTGTA 


ATAGTAAGTA 


CGAGGACCAT 


1440 




CTCTAAATCC 


rrrCGACTCC 


ATCGCAACTG 


ATAATTGATG 


TGCCTTTCTA ATATTTTGGC 


1500 




TTAATAGAGG 


TATAATTAAA 


TGCTTAAATC 


GCTTTAACCC 


TCTATAATTT 


GCCGCGTCTA 


1560 


SO 


TCATCTGATA GCGCATTTTT AAAGATCTGC GAAgcTGTAt TAAAGAACTA ATCATTAAAG 


1620 




GTATCATACG 


AATGGCAGCC 


ATGAATGCAT 


AAGCAACTTT 


TGATTTAACC 


TTTAAATGTT 


1680 
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ATGAAATAGC AATGGTTCTT AATGATACAT GTAAACCACG AACTAAACTT TCTGTTGTAA 1800 

TATGGATAAA TCCGAATTTC AAAATTGTAT GGCTACCATT CCCGTATAAA ATCATGAACA I860 

^ GGGAAGAGAG TAATGCAAAG CCAATACTTA TAGTTATAAA AATTGCTGTA ATTTTAAACT 1920 

GAGTACCATT AAACATCAAT AAGAAAACTA ACATTAAGAT AGTGATATAA AGCATAAAAT 1980 

CGAAATTATG CACAAATATA ATAAAGAAAA ATAGTATAAT TCCAAGAAAT AGTTTCGTTA 2040 

10 

TAATGTTGAC ATCATGAACA AATGATTGCC GAACTTTCCA TTGCTCATAC ATTCGTATCA 2100 

CCATCACAAT CTAGTAACGC ACCATCTGAA ATTTTAAGTC TTCTTGATGG ATAACGTTCA 2160 

ATTATTTCAT CGTCATGTGT AaCCATGACA ATACTTTGTC CCAAATTAAT TCGCTTTTGG 2220 

IS 

AAAAGTTTGA TCAACTGGAA TGTATTATGG CTATCAAGTC CAAATGTCGG TTCATCTAAA 2280 

AAGATAATAT CAGCTTTAGA ACTTAGTGCG GTAgcTACGC TAAGGCGTCG TTTTTGACCA 2340 

2Q ATAGACAACT CATAAGGATG TTGATCTTTT ACATTTTGTA AATCTAAAAG TTTTAAAAGT 2400 

TGTATCGTTT CATCATCACT TTGATCTTTA GAAAGGTGAT TAAAATGAAT GTTAATTTCA 2460 

TCATAAACCG AATTTGTTAT AAATTGTAAT TCTGGGTTTT GATAAACTAG GTACATGTGT 2520 

25 TTTGCTGCAT GTTTAATTTT TGTTAAACGC TGATTTTCAA AATAAACATC ACCTTGATAT 2580 

TTAATCAATT GCATAATTGA TTCAAGCAAG GTTGTTTTAC CACTACCATT TGCCCCTGTA 264 0 

ATTGTAATCC ACTCACCTAG ACCAATTTCT AAATCTGAGA ATGAGAGCAA TGTTGATTTA 2700 

CCGCGAATAA TACGTCCATT TTTAAATTGT AATAAGTGTG AGTTTGTTGT TGGAAAGTCA 2760 

ACACGACTTG GTGCGAATTC CCATGCACGT GGATGCCACA CACCATATTC ACTGAGTAAA 2820 

TGAACATACT TCTGTAATAT GATTTCAGGA CATTCATCGG CAATGATATT TCCGTTATAA 2880 

35 

TCCATCAAAA TGACGCGGTC GACATGATTC CAGATGTGTT TAACTTTATG TTCAACGATT 2940 

ACAACCGTTT GATCTTCCCA AAGTTCAATT AGTTTAGTCC ATAAATCTTC TGTTGCTTGA 3000 

ACATCTAACA TTGCTGTCGG TTCATCTAAA AACAATGTTT TTGATTGTTG AAGAATGGTT 3060 

40 

TCAACAATTG CCAATTTCTG TTTCATCCCG CCACTTAAAT CTTTGATATA CGTTTCAGGG 3120 

GTAACATTTA AATTGACCAT ATTTAAAGCA TTGATAATTA ACGCATCCAT GTCTTCACGT 3180 

^5 GGTAATTGTC TATTTTCTAA AACGAATGCA AGTTCTTCGT ATACTTTTGG CATACAAAAC 3240 

TGGCTATCAG GGTCTTGGAA AATAACGCCA CTTAATGGGT CAACGATTAG TTCATCATAT 3300 

TTCATAGGTA ATTCAATTAA ATTAGGAACA ATACCACTTA ATACATTCAG AAGTGTACTT 3360 

SO TTACCGCAAC CAGAAGGACC GAGTAAAAGT ACTTTTTCTT TGTCTTGAAT AGTGATATTT 3420 

AAATGATCGA AAATTTTACG TTGACCACTT GGATATTTTA ATCGTAAATC ACTTACTTTT 3480 
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ATTTTGTTAC GCCTGTCTTA TCTAAAGCTT TTACTAAAAG GTAAGATAGG ACGCCGGCGA 3600 

CTACTGCACC ACTAATTAAT CTAAATACGA TGAATAATGT TAAGTTCCAA CCTGCAACTT 3660 

^ CATTTAAATA ACCATAGAAA TAATCTATCG GGAAAGCCGC GATTGCTGTA CAAAAACCTG 3720 

CTAACATAGC TACCATAACT GAACGTGATT GATATTTAAA AATTGCAAAG ACAAGTTCAC 3780 

ACGCTAAACC TTGTATAAAA GCGTAAACGA TTGTCGGAAT ATCGAAACGA CCCATAATGA 3840 

10 

TAGTTTCGCC GGCACCTGCA GCAAATTCAG CCAGTAAAGC AATACCTGGT TTTGGAATAA 3900 

TTAGATAGCA GACAATCGCT GCCATGAACC AAACCCCGTT TGTTAA7TGT TCGAGGTGAA 3960 

GGCCTGTAGC TTGCACACCA TTGTAAACAA ACCACCATAA ATTGTAAATA ACTGCGAATA 4020 

15 

CTACTGAAAT AAGTACX3GTT ACTAGTATTT CAGATAGCTT TAAACCTTTT GACATTTTTA 4080 

CATCCTCCTA ATAAAAAAAC GCACAACCAT CCATAGGAAA GTTATGCGTT CACAATATAT 4140 

20 ATTAGTAAAA CATATGTATA GTAACACTTT CCTACGCTAG TTCAAGCTAG ATCAGGTTCA 4200 

AAGGGTTTGA GGGCAAGCCT CATCTCAGTA TAAAACACCC CTAGTGTGTG CGATTTATTT 4260 

AATTAATTAT ACTGTAAGAC GTTTGTAAAC TTATGTCAAT AGGTTGTCTT CATGAAATTT 4320 

25 CGTTrAATTC GATTTAAAAT TTATAATATT AGCATTGGAT TTAAATTGAA GATGTAGTAG 4380 

GAATGTTAGT AATTAAAGAT ATAAAAATAT GTGACATGTA ATAATATTGA GCTGATAAAT 444 0 

GAAGAGGGAT ACTTATCAAT CATACCTCTT TAACAACAGT GAAGAACCCG TGCATAATGG 4500 

30 

CTTACGAATT ATAGTTTATA AGGAAGAAGA GGGATACATG CGCCGAGCAC ATGCATAAAA 456 0 

GCCCCTAACA ACTAAAAGTT GTAAGGAAGG AGAGGGATAC ATGCGCCGAG CACATGCATA 4 620 

AAATCCCCTTA ACAACTAAAA GTTGTAAGGG GATTTAAATT AATTTAGTGT ATCTTGGATA 4680 

35 

TCTTGTTTTG kTTGaTTAAT ATCTTCTGTT TTTTCTTCTT TTTTATCTTT TAATTTTTCT 4740 

TCAACTTCTT TAGCTTTTTC TGCTGCTTTT TTATTTTGAT TTTCATTAGA CATGATTAAT 4800 

TCCTCCCAAA TTGGATAATT ATTTATATAT AAATCTTACC CGGTTGTACT TTCGTTAAAC 4860 

40 

TTTTCTAAGT CTATAGCACT ATTTATTCAT TTATCTAAAG ACAACAACAT TAGATTAATA 4920 

TAXAATGATT TTGAGGTGAA CATAATGTCT TTTCTTAGGA AACACGCCGA AATTATTTTT 4980 

45 AGCTATTTAA TCGGTmwCGT TcACTCTTCA CTGGkcTCAT TATTTTAATT AACTTGCCAT 5040 

TAATTAAACA ATTAAATGGT GGTAAA?VAAG TTGATACACA TGTTCATAAT GTGTGGGAAT 5100 

TTCTGAATGC ATTTTTCAGT GAAATTATTA AAGTAATGAG TCGATTTATA GGTAATTTCC 5160 

CtATAGTTAG TGCAATTGTG ATAATTATAT TCGGTATTTT AGTTATGTTG ATTGGTCATA 5220 

CATTAC7TAG AACTATTAAG TATGACTATG ATATTTCTAT CTTTTTCTTA GTTATCGGTA 5280 
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TTTTCATTAT TCCATTTACA ATTCATATAG GATATATCGT CTATAAAGAT GAATTGAATC 5400 

AGGAAAATGT AAAAAATCAT TTCATGTGGA TAATTGTGAG TTATGGTATA AGTTACTTAA 5460 

^ TTACACAAAT TGCATTGTAT GGCAGAATTG ATGCTAATGA AATAGAGTCA ATTGATATCT 5520 

TAAGTGTCAA TGCTTTCTTT ATAATTATGT GGTTACTTGG TCAAATGGCT ATTTGGAATT 5580 

TCTTGXTCTT GCGCCGAGCT TTACCTTTAA CAAAGCAAGA ATTAGGTGAA GAGGAGCCAG 5640 

TO 

AATTATCAAG AACAAGTAAA GGGAATGTCA CGAATCAAAC TAAAATTCAC TTGAAACAAC 5700 

TCCAAGATAA GACTACAGAA TATGCACGTA AGACAAGAAG AAGTGTCGAT TTAGATAAAA 5760 

TTAGAGCTAA AAGAGATAAA TTCAAAAAGA AAGTTAATGA TATTA7CGA7 ATTCAAGAAG 5820 

IS 

ACGATATTCC TGATTGGATG AGAAAACCGA AATGGGTTAA ACCAATGTAT GTCGAACTAT 5880 

TTTGTGGTGT CGTCATCTTT TTATTCACAT TTTTAGAATT TAATAATCGT AATGCATTAT 5940 

20 TTGTATCTGG TGATTGGAAA TTATCACAGA CACAATATGT TATTGAATGG GTTACATTAT 6000 

TAATTCTGTT ATTCATTATT ATCGCATATA TCGCTACAAC GTTAACTTTC CACTTGAAAG 6060 

GTAAGTTTTA TTATTTACAA TTATTTATGG GGAGCATTTT ATTCTTTAAA TTGTTAACGG 6120 

25 AATTTATAAA TATAATGATT CATGGACTAT TACTTTCAGT GTTCATTACG CCAACATTAC 6180 

TATTAATGTT ATTGGCAATC ATCATTTCTT ATTCGTTACA ATTACGAGAG CGACCATAAT 6240 

TAAAAGCATT ATAAAAGTAC TATCTATTAA ACATTTTGAT GTGTACGCTA TAAGTTAGAT 6300 

ATATCTCTAA CTTACTTAGA TACAGGTCAA TGAAGTTTAT GGATAGTACT TTTTTTGTAA 6360 

CTAGATTTGA TTGATTCAGG TGATGTGAAT TAAGTATTGA rAATTGTATA CAAAGTTTTA 6420 

GTGCAAATAA AATAGTTGAA AAGTTATCCA TrTGTAAAAT CAAGAAAACT AGTAAATAGT 6430 

35 

TGAAGCGACr TATGGaATTT GCGAAACGAT ATATAGTATT TCCTTTGTAG AAATTTmACA 6540 

TATATCATTC AAATTACTAA TTTGTTAAAA TCAACAGTAA GATTAGAAGT AGATGATATT 6600 

GAAATTTGGC AAACAaTtTA ATCTATATAA AACTACAACG AAACACAGAA AGGAAGTTGT 6660 

40 

CAGATGAAAA TAGCAACTCT GAACAAAGGC AAAGAAACAA AATATTTTAA TGGATATCCT 6720 

■ TTAATTGAAG AAGAGGATAT CTATTCACAA GATCATTTAA AAGAAGGAGA TATTTTTCAA 6780 

45 ATTGTGACTG ATAAATCACA ATAT 6804 

(2) INFORMATION FOR SEQ ID NO: 366: 
(i) SEQUENCE CHARACTERISTICS: 

{A) LENGTH: 1717 base pairs 
SO (B) TYPE: nucleic acid 

(C) STRANDSDNESS : double 

(D) TOPOLOGY: linear . 
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(xi) 


SEQUENCE DESCRIPTION: I 


SEQ ID NO; 


366: 








aaaACAGACG 


CATTaAAACA 


AGCTATACAA 


ATTATCGATA 


AATTAACATG 


GGGTGTTTAG 


60 


5 


TGGTGGTTAA 


AGAAATTTTG 


AGACTATTAT 


TCTTACTAGC 


GATGTATGAG 


CTAGGTAAGT 


120 




ATGTAACTGA 


GCAAGTATAT 


ATTATGATGA 


CGGCTAATGA TGATGTAGAG 


GCGCCAAGTG 


180 


10 


ACTTTGAAAA 


AATCAGAGCT 


GAAGTTTCAT 


GGTAATAGCT 


ATTATCATTT 


TTGAATTAAT 


240 


TATATTAATG 


TGTGTAGCAA 


TAGCACTGGA GGTGTTGTAA ATATGTGCAT 


TGTCATTTCA 


300 




ATTGlVrrAT 


CTATATnTTT 


ATTGATCTTG 


TTAAGTAGCA 


TTTCTCATAA 


GATGAAAACC 


360 


75 


ATAGAAGCAT 


TGGAGTATAT 


GAATGCTTAT 


CTTTTCAAGC 


AGTTAGTAAA 


AAATAATGGT 


420 




GTTGAAGGTT 


TAGAAGATTA 


TGAAAATGAA 


GTTGAACGAA 


TTAGAAAAAG 


ATTCAAAAGC 


480 


- 


TAAAGAGAGG 


CGTTGGCTTC 


TCTGCTCTAT 


CyAAAATAAT GAAAGGAGCC 


saACATGTTA 


S40 


20 


GaCiiAAGCCA 


CTCAAATAGA 


AACAATTAAA 


TATGATCGTG 


ATGTCTCATA 


TTCTTATGCT 


600 




GCTAGTCGTT 


TATCTACACA 


TTGGACTAAT 


CACAATATGG 


CTTGGTCTGA 


CTTTATGCAG 


660 




AAGCTAGCAC 


AAACAGTTAG 


AACTAAAGAA 


GATTTAACTG 


AGTACAATAA 


AATGTCTAAG 


720 


2S 


TCTGAACAAG 


CC6ATATAAA 


AGATGTTGGC 


GGATTTGTCG 


GTGGATATTT 


AAAAGAAGGC 


7B0 




AAACGGCGTG 


CTGGTCAAGT 


CATGAATCGT 


TCAATGCTAA 


CACTTGATAT 


CGATTATGCA 


840 




GCCCAAGATA 


TGACTGACAT 


ATTATCTATG 


'ITITATGATT 


TTGCATATTG 


TTTATATTCA 


900 


30 


ACACATAAGC 


ATAGAGAGAT 


AAGTCCAAGA 


CTGCGTTTAG 


TGATTCCTTT 


AAAACGAAAT 


960 




GTAAATGCAG 


ATGAGTATGA 


AGCTATTGGG 


CGTAAAGTCG 


CAGATATCGT 


TGGCATGGAT 


1020 


35 


TACTTCGATG 


ATACAACTTA 


TCAACCACAT 


AGGTTAATGT 


ATTGGCCTTC 


AACTAGTAAC 


1030 


GATGCGGAAT 


TTTTCTTTAC 


CTATGAAGAT 


TTACCTTTGT 


TAGACCCAGA 


TAAAATATTA 


1140 




AATGAATATG 


TTGATTGGAC 


TGACACATTA 


GAATGGCCAA 


CGTCTTCAAG 


GGAAGAGAGT 


1200 


40 


AAGACTAAAA GATTAGCAGA 


TAAGCAAGGC 


GACCCAGAAG 


AAAAGCCGGG 


AATTGTTGGr 


1260 




GCATTTTGTA 


GAGCCTATAC 


GATAGAAGAA 


GCTATAGAAA 


CTTTTATTCC 


TGATTTATAC 


1320 




GAAAAACATT 


CTACTAACCG 


TTATACCTAT 


CATGAAGGTT 


CAACTGCAGG 


TGGATTGGTG 


1330 


jt •» 
4o 


TTATACGAAA ATAACAAGTT 


TGCCTATTCT 


CATCATAATA 


CGGATCCCGT 




1440 




CTTGTGAACA 


GTTTTGATTT 


AGTACGCATA 


CACTTATATG 


GTGCTCAAGA 


TGAAGAAACT 


1500 




AAAACAGATA 


CTCCGGTTAA 


TCGACTACCT 


AGTTATAAAG 


CAATGCAGCa 


AAGAGCGCAA 


1560 


SO 


AATGATGAGG 


TTGTTAAAAA 


GCAATTAATT 


AATGACAAAA TGTCTGATGC 


AATGCAGGaT 


1620 




TTCGATGAAn 


GAGAAAATAG 


CGATGATGCA 


TGGTCTGAGA 


CGTTnGAAAT 


TACTTCGAAA 


1680 
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{2) INFORMATION FOR SEQ ID NO; 367: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1847 base pairs 
^ (B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

10 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 367: 

AAGATTAGGC ATCAAGACAG GGTCGCGATT GTTTGAAATC CCACATAGnA ATGATATTTa 60 

CaTTATCAAT CCaAGTATGC GTAAATATCT TAATGTTTCA GTTGCTATTT CTAAGATTGC 120 

ATTGCGTTAT ATTCCACCTG AAGATTTACA CCAATATAGT ATTGACGAAT TTTTTATGGA 180 

TGTTACTGAT AGCTATCATA GATTTAGTTC TACAGTACAT GCATTTTGCG AAAGACTTAA 240 

2^ ACGTGAAATT TATGAAGAAA CAGGCATTTA TTGTACTGTG GGCATTGGTT CTAATATGTT 300 

ATTAAGTAAA ATTGCTATGG ATGTTGAAGC GAacATAGTc AAAATGGTAT AGCTGAATGG 360 

CGATATCaAG ATGTACCAAC GAAATTATGG CCAATTCmGC CCCTGCGAGA TTTTTGGGGT 420 

25 ATTAATCGTC GAACAGAAGC CAAATTGAAT AAAAGAGGAA TTTTTACTAT AGGAGATTTA 4 80 

GCGAAATATC CATATAAATT TTTAAAAAAA GAGTTCGGTA TTTTAGGTGT TGATATGCAT 540 

CTACATGCGA ATGGGATAGA TCAGAGTAAA GTACGTGAAA AGCACAAGAT CAGCAATCCA 600 

TCGATATGCA AAAGTCAAAT ATTAATGAGA GATTATCATT TTGATGAAGC AAAAGTAGTA 660 

ATGCAAGAGT TAATTGAAGA TGTTGCTAGC AGAGTTCGAG CAAGAAAAAA AGTGGCAAGA 720 

ACGATACATT TTGCCTTTGG CTATAGTGAT GAAGGCGGTG TACATAAGCA ATATACTTTG 780 

35 

AAAGATCCAA CAAACTTAGA AAAAGATATT TATAAAGTAG TAATGCATTT CGCAGATAAA 840 

TTATGTAATA AACAAGCACT ATATCGTACG CTAAGTATAT CTTTGAGTCA ATTTATTAAT 900 

GAGGATGAGC GACgTTAAGT CTGTTTGAAG ATGAATACCA ACGCAAACGT GACGAATGTC 960 

40 

TAGCTAAAAC GATAGACCAA TTACATTTGA AATACGGCAA AGGTATTGTG TCCAAAGCAG 1020 

TATCGTTTAC AGAAGCAGGT ACAAAACACG GCAGATTAGG TTTAATGGCT GGACATAAAA 1080 

TGTAATGACT ATACGGTTTA AGTAATATAT AACTGTGATT CGTATAAAAT AAGTCTCTAA 1140 

AGATAAATAT TTCATATATC ACAATAGATT TTCACAATAA TATCTAAGAA TACATGGAAT 1200 

TTATCAAAAG AGACTTAATA ATTATTGGAT ATAACAATCA AAATCACTCA ATGCTTGCAT 1260 

SO ACCGCGTTCT CGGTCAGTAG GGTTTTTGAA ACTAATTTTT AAAGCACCGT ATATATCTTC 1320 

GCGTACTTCT AAGATTCTTA AGTTGCTTAT AGATATGTTA TGTAAACTCA GGATATAAGT 1380 
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TAGTCCACCT AGTTGTTTAG CGGGTAGTGC GTCGCGATAC GATTTAGCTT GGGCAAAAAA 
TGATAACAAT TTTTCAGAAT CATTGCTTTC AATTAGTCTt TCTAAATCTT GAAACTGACT 
TTTTAGCTGT CGAATCATTT CTAAAATATA CGTTTTATTA CTCAAGGTGA TATCTTTCCA 
CATTTGTGCA TTACTACTAG CTATACGAGT GATATCACGA AAACCACCAG CTGCAAGTTT 
ATTAACTAAA TGATGTTCTT GACCGTTCTT TTGACTAACA TGAACTAAAC TAGATGCAAC 
GATATGAGGT AAATGACTTA CGACGCTTGT TACGTAGTCG TGTTCTTCAG CAGTAGTTAC 
AATAAATTTA GCAAGAGTAG GTGATAACAG TTCTTTTAAC GTGTTTG 
(2) INFORMATION FOR SEQ ID NO: 368: 

(i) S2QUENCE CHARACTERISTICS: 

(A) LENGTH: 4 94 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDSDNESS : double 

(D) TOPOLOGY: linear 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 363: 
AACAAAAGGC ATAAGTTCGT GAATTAATGC GTATACAAGG ATAAAGCTTA TAACAGTAGT 
AATTGTTGCT ATCAAACGAA CAACATATAT TCTATTTTCA GATAGCAATC GATTCACTAA 
TOGATAATTT ACGTATACAA GAATTAACAA CAGCACAATA TAAACAATAA TCATATTTGG 
CCCCATTTAA TTTTTAAATT TGTTTTCACA TCATTTTCTA CTTTATTATC ATACTAATTT 
TAAAGGCAAA GGTGGACATC GGCAACCTCT CGTAAACTAT TTATCAAAAA TAAACGTATC 
TCATTGTTAT GATATTTATA AATCAATTCG TTTTTATTAA AGTCTTTTTC AACAAGTTTG 
TCACTATCTA TTAAATAATC ACGCATGCAT CCTTTTAAGA AATCATCTTT ATAACTTGGT 
GTGTACCATT TTCCATCCTC TTCAATGACA ATGTTGCCAA TATCAAATTC AAGGACCTTG 
CCGTCCTCTG AAGT 

(2) INFORMATION FOR SEQ ID NO: 369: 

(i) SEQUENCE CHARACTERISTICS: 

<A} LENGTH: 2518 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDSDNESS: double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 369: 
GTCCATATTT CCCGTCCAAC CAACTAAAAA TGGGTAAATC CCTGGATTTa AATCTACTTC 
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GATAATTTCn AATGTAGCGA CCATCATTAC GAGATGATTT GATATAAGCA CAGTTTGGAT 180 

GTTGACCAAT ACTATCGCCT TCTTCTTCGA TGATATCTAT TTTAATACCA TCATCAGCTG 240 

^ CAATTTCTAA TGAAGATTTA ATTCGGTTAT CAAATGTTGA ATATCCCATT GCTCCACCCA 300 

CAATAGCGAC ATCTGTACCA TGTCCTTGGT GTGTTTGAGC AAATGATTCA TAATAATGTA 360 

TTTCAATATT TTTAGGAATA TCTCCCAATA TTGCGCGTGC TGAATTCCCA ATCTTTACTG 420 

10 

CACCAGCCGT ATGAGAACTT GAAGGGCCCA TCATAACTGG TCCGATAATA TCGAAAGCAC 480 

TTTGATAATC ATAGCTCTTT GCCATAATTA AACACTCTCC TTAATATGAT TCTTTTTGCT 540 

CGGCATTTTA AAGTTGATAT TCATTAAATT AAACTTATTA ATTAGTGTTC CAATAATATA 600 

75 

GGCTAAGACA ATGCTGACAA TAATCACTGT TGCGATTGTT ACAATTGATG TCACTGCATT 660 

ATTAAAGCCA AACAATACGA TGGCGCCTGC AATTGGTGTT GCCATACCTT TGACACCTAT 720 

20 TACTAGTCCG CTAAATGTCA CGATACATGC GTTGACGACC CCAATCAGTG CATTTGTACC 7 80 

ATATAGTTGT ACTGGATATT GCGCTATTAA ATCAATTTGC GTCAATGGCT CAATACAAAC 840 

TGCAAATGCT TTTGACGGTC CACCAATGTT TAATTTTCGG AATAAAATAA GGTTAACAAA 900 

25 TGAGCTACCT GTACATGTTA GTGCTCCAAT AGCCATAGGA ACACCTGTCA GTCCTAATAA 960 

ACTTGTTAAT ACCATTGAAC TTAGCGGTGT CATACCTGTA ACAGGAATCA CTAGTCCTAA 1020 

AATGACCGCT AATGCATATG GATTGTTATC ACCTACCGCA GTGACAGCAC TACCTATTTG 1080 

30 TTTTAATGTT GCTAGCACAC CAGGTGTAAT GATTGATGCA AGTCCGAAAG CAATTGCTGG 1140 

TGCAAATAAG ATCACCACAA TTAAGTCCAA GCCTTCTGGA ACTTTCTTTT CAATCCATTT 1200 

AATTAAAAAA GcTACGCCAT AAGCTGCGAT GAATGCTGGT AATAATTTAA AGTCATGTAA 1260 

35 

TACTAAACCA ACAATGACCG CAAATACTGG TGCAACGCCT AAGTTTAAGC ACGTTAGAAT 1320 

ACCTACTGcG ATACCGCTTA AACTTCCTGC TAAATCCCCA ATATCTTGTA GAAATTTAAT 1380 

ATCAAATACG CCACCAATAG CATAACTTAA GAATGCTTGT GGTAGAAATG TCGCACAAGC 1440 

40 

TGCACCGGAT AATGCTTGTA GTCCTTGTTT ACCGTACGGT GCATACTTTA AAAATAGCGT 1500 

CATGATCACT AAAACCAAGA CTAATGTGCC TACACCTAAC AGAATATCCA TTTCCCAAAA 1560 

45 ACCTCTCTCT ATGTTTATTT TATTTTCAGA CCATAAACAT CGTACACCCT TAAGAAAACG 1620 

TTTTCAACTT TTATCTGTTA TCAAATCaAA TATTTAAGTG AAATATTTCA TATTTGTGAA 1680 

AGATTTTTAA AATGGATTGT TTCAAAAACT ACTTATGTTG TCGTTAATAT TTACTAATTA 1740 

so ACTTTTTACT CTATATTTCA AACAGTTGTG TGACAGTTTT TTGATAACTT TTTTACATCT 1800 

GAAAGTAAGT AATATTTCTA AAAACTTTTA ATATTTATAC ACTTTATCTT TCGAGCTATT 1860 
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ACACATATAT TTGCAATAAG ATAATTAAAG TAGGATATTA mTTAGTTT TCTGATAGGA X980 

ATGATGATAG TCTATAGGTT GAATCTTTAC TTTTTTTTAA AGCTAAATTT ACATCAACTT 2040 

^ AACAATGGTT GGTTATACTG AAGATGAAAA TATTTAGTAT AACTTAGTGG AGGCGATAAA 2100 

GGTGCAATTG AGTCATTCCG TTAAAGTTGC AATTTCTATC TATTTAGCAC TTATCTTTAT 2160 

AACGTTCACT TCTTATTTAG TCATTATTTT ATATACGAGT ATGACTGGAC ATGATGTATC 2220 

10 

ACATTTCGTG TTAGATAGTC AGCATTCTCA TCATGGATCT CTTACGCAAA AACATTTGAG 2280 

TCTTCCTGAA ATCTCATTTA AATAGTTTAT CCTCTGTGTT TCAACATTCA TTTCCCATAT 2340 

CGATTCATTT ATCTATCATC TAGACCACTA CATCTTAGAT G A TTTTTTTA TTTTCTCATT 24 00 

15 

TCACTCTTTC TTAAAAGTCG ATATAATGAA TTAAATCATT ATCATACACC GACATATTTT 2460 

ATGTTGTTGG TGTTAAGTTT aAAGGGGTGA GATACTTGGC GAATclATCaT TCAGCTTT 2518 
2^ (2) INFORMATION FOR SEQ ID NO: 370: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 790 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEONESS : double 
25 (D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 370: 

ATACTACTGG ACCGTCnACC AATTGACAAA ACCTGAAAAC TCGATTTTTA TTGCAGGATT 60 

ACATCGAACC TGGAAGAACA ATCCCCAGGA GTTGATGATA TTCGAGATAT GGCATACAAT 120 

CAAGGTAGTT TAGATAAGAC AATTTATGAA ATTTCTAAAC GCACAGTACT ATTTTTAATA 180 

35 

CAGAAAGATA TTACGGTATA TAATAAGACG ATTGACTGTT TAAATTATTA TAACTATAGT 240 

GACGAAAGAA TAAAGGATGA TTAAATGAAT TCACAAGAAT TATTAGCAAT TGCTGTGGAT 300 

GCAATTGACA ATACCCCAGG CGAAGATACG ATTTCTTTAG AAATGAAAGG TATCAGCGAT 360 

40 

ATGACAGATT ATTTTGTTGT AACGCACGGA AATAATGAAC GACAAGTTCA AGCGATTGCT 420 

AGAGCGGTGA AAGAAGTAGC CAATGAACAA AATATAGAAG TAAAACGTAT GGAAGGATAC 4B0 

AATGAAGCGC GTTGGATATT AATTGACTTA GCTGATGTTG TGGTACATGT TTTCCATAAA 54 0 

GACGAAAGAA ATTATTATAA TATTGAAAAG TTATATCAAG ATGCACCATT AGAATCATAT 600 

AGTCAGGTTG CGTATTAATT ATGTCGCAAT ATGCAGAAAT GAGCCTAGTG TACGATCAAT 660 

SO ' TGACTCAAGA TCAACCATAT GAAAAATGGT TTGAAATTGT AAAAAATCAC TGCAAAGATG 720 

AATCAAATAT TTTAGATATT GGATGCQGTA CTGGTAGTTa ACAGTTCAAT TAGAAGCTTT 780 
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15 



20 



(2) INFORMATION FOR SEQ ID NO: 371: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1823 base pairs 
(3) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



10 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 371: 

ATAGATGAAG GTGCAAATAT TGAAaTAGGT TATTTACCTG GACGCTTGAA ATGGTTAGTT 60 

GCTGATTTAT TAACTAAACA AGGATTAAAA GTAGTTAACG ACGATATGAC AGGAAGAACG 120 

TTAAAAGATC GTAAATTATT AACAGGTGAC AGTCCTTTAG CTTCAAATGA GTTAGGAAAA 180 

TTAGCAGTTA ATGAAATGTT AAATGCAATA CAAAATAAAT AATTAAATAT TAATTAGAGG 240 

AGCCTCATAT GTAAATGTAT GAGGGCTCTT TTTTTTGGCA AAATTTAAGT GATACTTGTA 3O0 

AAATAGAACC TATTATGAGT ATGATTTAAG AAAACGCTTG CAAAACTAAT AACCGCAACT 360 

AGCGATATGG AGGAAACATG ATGTCTTATA GCATTGGAAT TGATTATGGA ACTGCTTCAG 420 

25 GCCGTGTGTT TTTAATTAAT ACAACTAACG GTCAAGTAGT ATCAAAATTT GTGAAACCAT 480 

ATACACATGG TGTCATTGAG AGTGAATTAA ATGGTTTGAA AATACCACAT ACATATGCAC 540 

TTCAAAATAG TAATGATTAT tTAGAAATTA TGGAAGAAGG AATATCATAT ATAGTACGTG 600 

AATCAAAAAT AGATCCAGAC AATATAGTAG GTATTGGTAT AGACTTTACT TCATCTACTA 660 

TTATTTTTAC TGACGAAAAC CTTAACCCGG TACATAACTT AAAACAATTT AAAAACAATC 720 

CACATGCGTA TGTGAAACTT TGGAAACATC ATGGTGCATA TAAAGAGGCA GAGAAATTAT 780 

ATCAAACTGC TATTGAAAAT AATAATAAGT GGTTAGGCCA TTATGGATAT AATGTTAGTA 840 

GTGAATGGAT GATTCCCAAA ATAATGGAGG TCATGAATCG AGCACCAGAA ATTATGGAAA 900 

AAACGGCTTA TATTATGGAA GCGGGCGATT GGATTGTAAA TAAATTAACT AATAAAAATG ' 960 

TACGCTCGAA TTGTGGATTA GGTTTCAAAG CATTTTGGGA AGAAGAAACA GGGTTTCATT 1020 

ATGATTTATT TGATAAAATA GACCCCAAAT TATCAAAAGT AATTCAAGAT AAAGTATCTG 1080 

45 CACCGGTTGT TAATATTGGT GAAGCAGTAG GGAAACTGGA TGATAAAATG GCACAGAAAT 1140 

TAGGATTATC AAAAGAAACT ATGGTAAGTC CTTTTATTAT TGATGCCCAT GCTAGTTTAT 1200 

TAGGTATTGG GTCTGAAAAA GATAAAGAAA TGACTATGGT GATGGGAACA AGCACATGCC 1260 

SO ATCTTATGTT AAATGAAAAG CAACATCAAG TGCCAGGTAT ATCAGGTTCT GTAAAAGGAG 1320 

CAATTATTCC AGAATTATTT GCTTATGAAG CGGGGCAATC AGCAGTAGGT GATTTGTTTG 1380 
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CTGTATTTGA ATTAATGAAT GAAAAGATAA AACATCAAAT GCCAGGTGAA AGTGGGCTCA 1500 

TTGCTCTTGA TTGGCATAAT GGAAATCGAA GTGTATTAAG TGATAGCAAT TTAACAGGTT 1560 

GTATCTTTGG ATTAACTTTA CAAACTAAGC ATGAGGaTAT TTATAGAGCm TATTTaGaAG 1620 

CTACaGCATT TGGTACtAAG ATGATTATGC mACAGTATCA AGATTGGCAT ATGGaAGTAG 1580 

aAAAGGtATT TGCaTGTGGc gGTAtACCtA AAAAGAATGC TGTTATGATG GATATCTATG 1740 

CGAATGTACT GAATAAAAAA CTAATTGTTA TGGATAGTGA GTATGCACCA GCAATAGGCG 1800 

CAGCAATATT AGGTGCAGTC AGT 1823 

(2) INFORMATION FOR SEQ ID NO: 372: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1600 base pairs 
fB) TYPE: nucleic acid 

(C) STRANDEDNE5S: double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 372: 

25 ACGATCATCT GCATCAGCGA ATTCCGATGc AaTTcATATG tCCtAATAAC AAAAGAATAG 60 

GTTTTaAAAG ATATGCATAC CGTAATGaTA GATATAGTTT TAAACGTGAC TTCAAGCTAT 120 

ATGaATGTGA TGACTGTTCA TCATGTTCTT TGAGACATCA ATGCATGAAG CCAAATTCGA 180 

30 AATCCAATAA GAAAATTATG AAGAATTATA ATTGGGAATA CTTTAAAGCC CAAATTAATC 240 

AAAAGCTTTC TGAACCAGAA ACGAAAAAAT CTATAGTCAA AGAAAAATTG ATGTAGAGCC 300 

TGTTTTTGGA TTTATGAAGG CTATTTTGGG TtTCACTCGA ATGTCAGTTC GGGAATAAAT 360 

AAAGTTAAAC GAGAGCTAGG. TTTTGTATTA ATGGCACTTA ATATAAGGAA AATAgcaGCT 420 

CAACGAGCTG TACATTATAA AATACATATC AAAAAAGCTG ATTTCTATCA AATAAATAAT 480 

AGAAATCAGC TTTTTTACAT TGCCTAAGAA CTTTAAGGAA CTTAATGTCC CAAGCTCTTT 540 

TTTGTTATAT CTAATTCGTA ATTTATGATT GTTTATTCGG TCCTTTGATG TTCACTAAAT 600 

GTGACTTTAA ATCTTGTTCT AATTGTTGTA ATTCTTTTTC AGCTAATTGT CGTTCTTCGC 66 0 

GACCGTGTTG TTGAATAATT AATGTTTCTT CAATTGTCTC AATAATGTTA CGCTGTGTAC 720 

GTTTCAATGT ATCAAGATCA ACAATGCCAC GCTCATTTTC TGTTGCAGTT TCAATCGCAT 76 0 

TrrGTTTCAA CA'lTTCAGCA TTTGCTGTTA ATAAATCATT AGTTGTATCA GTGACAGCTC 840 

SO GXTGTGCAGC AACTGCATTA CGCTGTCTCA TTAATGTAAG CGCAATGGCC ATTTGATTTT 900 

TCCATAGTGG AATACTTGTC AAAATTGAAC TTTGTATCTT CTCGGCAAGT GCTTGATTAA 960 
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AGTCATATAT GCGTTTATCT AGTCTATCTA TAAATTGCTG CATATCTGCA ACTTGTTGAA 1080 

TATCCATTTG ATTAGTGGAt TgtGCGCTTG CTGTTGCAAT TGTGGTAGCT TTTCATTTTC 1140 

^ TAATTGCAAC TTTTTTTGcT GTGCAGCAAT GATATGCAAT GATAAGTCAT CAAAGTATTG 1200 

TTTGTTTTTA TCATATAGCG TATCTAATAA TTCAATATCT CTTGTTAAAT GTGTTTGATG 1260 

TTTCTGCAGT TGAATCGTTA TGCGATCGAC TTGAGCACTA ACTGATTGCA TTCTTGAAAA 1320 

10 

GATTTCATTG ATAGACGACT TTGCTCTGCT AAAAATTCTT TTTAACATAG ATGGTTTATC 1380 

AGTATTTAAC TCATTTGGAT TAACTGACTT TAGTTTTGAC ATTAGATCTG ACAAAGTATC 1440 

TCCAATAGGA CCAACATCTT TACTTTGTAC TTCATCCAAC ATTTGATGTG AAAATTGAGA 1500 

75 

CATTTGTTTC TGkAAATCAG AACCAAACGC TAATAAACCT TCATTGTCTA AAGGGTTAAT 1560 

TTGTTTACTG ATTGTGTCTA CCTGTTTTTG TTGTTCAATT 1600 
20 (2) INFORMATION FOR SEQ ID NO: 373: 

(il SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1227 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
25 (D> TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 373: 

ATGTTGATAA TGGTAGCTTC TACAAGAATA AAGACCAACA AGTTGGTGCA ACAATTCTTG 60 

aXAGTAAAAC TGGTGGTTTA GTTGCTATAT CTGGTGGACG TGATTTCAAA GACGTCGTTA 120 

ACAGAAACCA AGCAACAGAT CCTCACCCTA CTGGTTCATC TTTAAAACCT TTCTTAGCGT 180 

35 

ATGGACCTGC CATTGAAAAT ATGAAATGGG CAACAAACCA TGCGATTCAA GATGAATCTT 240 

CATATCAAGT TGATGGTTCT ACATTTAGAA ACTATGATAC GAAGAGTCAC GGTACTGTAT 300 

CTATTTATGA TGCTTTACGA CAAAGTTTCA ATATCCCAGC TTTAAAAGCT TGGCAATCAG 360 

40 

TTAAGCAAAA TGCTGGTAAT GATGCACCTA AGAAATTCGC TGCCAAACTT GGCTTAAACT 420 

ACGAAGGCGA TATTGGTCCA TCTGAAGTAC TTGGTGGTTC TGCTTCAGAA TTCTCACCAA 480 

45 CACAATTAGC ATCAGCATTT GCTGCAATCG CTAACGGTGG TACTTATAAC AACGCGCATT 540 

CAATTCAAAA AGTAGTTACT CGTGATGGTG AAACAATCGA ATACGATCAT ACTAGCCATA 600 

AAGCGATGAG TGATTACACT GCATACATGT TAGCTGAGAT GCTAAAAGGT ACATTTAAAC 660 

CATATGGTTC TGCATATGGC CATGGTGTAT CTGGAGTAAA TATGGGTGCT AAGACAGGTA 720 

CTGGTACTTA CGGTGCTGAA ACTTATTCAC AATATAATTT ACCTGATAAT GCAGCGAAAG 780 
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AAGTTAAACA ATATGGTGAA AACTCATTTG TrGGACATAG CCAACAAGAA TATCCACAGT 900 

TCTTATATGA AAATGTGATG TCAAAAATTT CATCTAGAGA TGGCGAAGAC TTTAAACGTC 960 

CTAGCTCAGT AAGTGGTAGT ATCCCATCAA TCAATGTTTC TGGTAGTCAA GATAACAACA 1020 

CTACAAATCG TAGTACACAC GGTGGTAGTG ACACATCAGC AAACAGCAGT GGTACTGCAC 1080 

AATCAAATAA CAATACTAGA TCTCAACAAT CTAGAAACAG CGGTGGATTA ACAGGTATAT 114 0 

TCAACTAATC CACTCAACAT AAAATCCTCA GTTATACCAT ATTTATGGTG TAGCCGAGGA 1200 

TTTTnTTAGG TTCTTCATCT TTTATGG 1227 
(2) INFO^y^ATION FOR SEQ ID NO: 374: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1953 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 374: 

25 CCATATGGtG CAACATTCTT CGTATTTAGT GATTATTTAA AACCAGCGTT ACGTTTATCA 60 

TCAATTATGG GATTAAATgC aACGTTCATC TTCACACATG AyTCaATTGC AGTAGGTGAA 120 

GATGGTCCTA CTCATGAACC AATTGAGCAA TTAGCTGGAT TAAGAGCCAT TCCAAATATG 180 

AATGTTATCC GTCCTGCTGA TGGTAATGAA ACAAGAGTAG CATGGGAAGT TGCCTTAGAA 240 

TCTGAATCTA CACCTACTTC ATTAGTATTG ACACGTCAAA ACTTACCGGT ATTAGATGTA 300 

CCAGAAGATG TAGTTGAAGA AGGCGTTCGA AAAGGTGCCT ATACAGTTTA TGGCTCTGAA 360 

GAGACACCAG AATTCCTATT ATTAGCTTCA GGTTCAGAAG TTAGTCTTGC AGTTGAAGCT 420 

GCTAAAGATC TTGAAAAACA AGGTAAATCA GTACGTGTTG TTTCAATGCC TAACTGGAAT 4 80 

GCATTTGAAC AACAATCTGA AGAATATAAA GAATCAGTTA TTCCATCAAG CGTAACAAAA 540 

CGTGTTGCGA TTGAAATGGC TTCACCGCTT GGATGGCATA AATATGTAGG. TACTGCAGGT 600 

AAAGTTATTG CTATTGACGG CTTTGGCGCA AGTGCACCTG GCGATTTAGT AGTTGAAAAA 660 

^5 TATGGATTTA CAAAAGAAAA TATCTTAAAC CAAGTTATGA GCTTATAAGA ATAATTTATA 720 

AAGCGAGTAT GTTTAGAAGT CTAGGATGCA TAATCTTAGG CTTCTTTTAA AGTGTTGAAA 780 

TTTAGAGTAT AGCACTTAAA CTACATCATA AGTGATAAGT TATGAAAGTA TACTATTTCA 840 

SO GATTAATCTT TAAAAGCTCT GTTATAACAG CATGATTTTT GATATTATTT TTAGTATCGA 900 

TATTAAAATA CTTGAATAAA CTAGTTCTTG AAATAATGTG ATGAATTTAG TAAAATTCAG 960 
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TGCATTAATT TTAGGTTTAA TTGGAGGTTT CCTTTTAGCT AGAAAATATA TGATGGACTA 1080 

CTTGAAGAAA AACCCACCAA TCAACGAAGA AATGCTTCGT ATGATGATGA TGCAAATGGG 114 0 

TCAAAAACCT TCTCAGAAGA AAATTAATCA AATGATGACG ATGATGAATA AAAATATGGA 1200 

TCAAAATATG AAGAGTGCGA AAAAGTAAAT TCGCAATTGA TAGAGGCTAT TTTCCAGATA 1260 

TGGAAATGGC CTCTTTTTAT AATCAAATTA ATAAGAATAA ATATGTTTAT TAAAATTAAA 1320 

GTTAACAAAA TGACGAATAG ACTGAGAAAT GCTATAATTC ATTTTGTATG ATTTACAGAG 1380 

AGTTTArrTA ACGAGAAGGT GTCyGCGTGC TCTATTTAAT ATTTTCAATC ATTGTAGCTT 1440 

TATTTATGGG AACTATAGTT ATAGTTATTC GTATGAAAGC TCAAAATTAT CCGGTAAAkG 1500 

AGAAAAAAAT AGTTTTGCCa CCgTTTTTTA tGGCgACCGG TGCATTGATG TACGTCGTTC 1560 

CaTATTTTAG GCTAACAGGA TCGGAAATGC TAGAAGCCTT TATAATTGGT TTGCTTTTTT 1620 

CtACAGTTCT AATTTGGACT TCTCGATTTG AAGTCAAAGG TACAGAAATT TATATGAAAC 1680 

GATCTAAAGC ATTTCCAGTT ATTTTGATTT CATTACTTAT CATTCGTACT GTGATGAAAA 1740 

TATTCATTAG TAATGAAATA GATCCTGGAG AATTAGGCGG CATGTTCTTT TTATTAGCAT 1800 

25 TCTGTATGAT TGTTCCTTGG AGAGCAGCAA TGCTATATAA ATACAAAAAA CTAAAGAAAA 1360 

CATTAATCAA TTAATTACTT TTaAAACCAC TTGTGATCGA CTTCTAAATC AGTCAATGAG 1920 

TGGGTTTAAT nTTACTTGGA AAAGGnGGAA AGG 1953 
(2) INFORMATION FOR SEQ ID NO: 375: 



15 



30 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3787 base pairs 

(B) TYPE: nucleic acid 
35 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 375: 

ACATTTGATC AAnTTATCGA CATTAAAGAT GAATTCAnTT GATCGTnTCA ATGATTATCC 60 

TGTTGAAGTA GCACGTTTGC TTGATATAGT GGAmATaAAA GTACACGCAT TACATTCAGG 120 

TATCcACGTT GATTAAAGAT AAAGGGAAAA TAATTGATAT TCATTTATCT GTAAAAGCCA 180 

CTGAAAATAT TGATGGCGAA GTGCTGTTCA AAGCAACACA ACCTTTAGGT AGAACAATGA 240 

AGGTTGGTGT TCAAAATAAT GCAATGrCAA TTACTTTAAC GAAACAAAAT CAATGGCTTG 300 

ATAGTTTGAA GTTTTTAGTT AAGTGCATTG AAGAAAGTAT GAGAATCAGT GATGAAGCAT 360 

AAAGAAGCAT TTAATGGCGT TGTCGTGTTA ACTGCTGCAT TAATTGTCAT TAAAATTCTG 420 
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CAACAAGTGT ATCCAA7TGT AGCATTAGGA ATGATATTAT 


CGATGAATGC 


CATTCCTAGT 


540 




GCAATTACAC 


AAAATATAGG 


GAAGTATCAT 


AGTGACGAAG 


CATATGCAAA 


AGCAGTCGCT 


600 


5 


TATATACAAT 


TAGTTGGTAT 


ATTATTATTT 


ATTGCTATTT 


TTGTGTTTGC 


GAACAATATT 


660 




GCACATATGA 


TGGGTGATGG 


CCATTTAACA 


CCAATGATTC 


AAGCTGCAAG 


TTTAAGCTTT 


720 


10 


ATATTTATAG 


GTATGCTTGG 


CGTGTTAAGA 


GGTTATTATC 


AATCTGCAAA 


i 

TAATATGACA 


780 


GTTCCGGCTA TTTCCCAGGT 


TATAGAACAA 


GTTATACGAG 


TAGGTATTAT 


CATTGTTACT 


840 




ATTGTTATTT TTGTAGACAG AGGTTGGACG 


ATATATGAAG 


CGGGAACAAT 


TGCTATTTTA 


900 


IS 


GCATCAACGA 


TAGGTTTTTT 


AGGTTCTTCA 


ATTTATTTAG 


TAGCGCACCG 


ACCTTTTAAG 


960 


TTTAAAATGG 


TAAATAACAC 


TGCAAAGATC 


GTTTGGAAAC 


AGTTCGCACT 


TTCGGTTTTG 


1020 




ATTTTCGCTA 


TCAGTCAATT 


AATCGTAATT 


TTATGGCAAG 


TGATTGATAG 


TGTTACTATT 


1080 


20 


ATTAAGTCAC 


TTCAAGCGAT 


ACGCGTGCCA 


TTCGATGTTG 


CCATAACTGA 


AAAAGGAGTC 


1140 




TATGACCGTG 


GTGCATCATT 


TATTCAGATG 


GGATTGATTG 


TAACTACAAC 


ATTTAGTTTT 


1200 




GCGCTCATTC 


CTCTGTTAAG 


TGACGCAATC 


AAAATGAATA 


ATCAGGTACT 


TATGAATCGT 


1260 


25 


TATGPAAATG 


CGTCATTAAA 


GATTACGATT 


TTAATAAGTA 


CAGCAGCGGG 


AATAGGATTA 


1320 




ATTAATTTAT 


TGCCTTTAAT 


GAACGGTGTG 


TTTTTTAAGA 


CGAATGATTT 


AACCTTAACG 


1380 




TTAAGTGTTT 


ATATGATTAC 


GGTCATTTGT 


GTATCGTTAA 


TTATGATGGA 


TATGGCATTA 


1440 


30 


TTACAAGCGC 


AACATGCTGT 


GAGACCTATT 


TTTGTTGGTA 


TGACGGCAGG 


ATTGOTTATT 


1500 




AAATTTATAC 


TTAATATCAT 


TTTGATTCGT 


TTAAGTGGCA 


TTATTGGTGC 


GAGCATTAGT 


1560 


35 


ACTGTTGTAT 


CATTAATTAT 


ATTCGGTACG 


ATTATCCATA 


TTGCTGTCAC 


GAGAAAATAC 


1620 


CACTTATATG 


CGATGAGACG 


ATTTTTTATC 


AATGTTGTTT 


TAGGTATGGT 


ATTTATGTCG 


1680 




ATTGTTGTTC 


AATGCGTGTT 


AAACATAGTG 


ACAACACACG 


GTAGAATCAC 


TGGACTCATT 


1740 


40 


GAATTATTAT 


GTGCAGCAGT ATTAGGTATC 


ATTGCATTGT 


TTTTCTATAT 


TTTTAGATTT 


1800 




AATGTTTTGA 


CATATAAAGA 


GTTAACTTAT 


TTACCATTTG 


GTTCAAAGTT 


GTATCAAATT 


1860 




AAGAAAGGAA 


GACGTTGATG 


GCACATACCA 


TTACGATTGT 


TGGCTTAGGA 


AACTATGGCA 


1920 


HO 


TTGATGATTT 


GCCGCTAGGG 


ATATATAAAT 


TTTTAAAGAC 


ACAAGATAAA 


GTTTATGCAA 


1980 




GAACGTTAGA 


TCATCCAGTT 


ATAGAATCAT 


TGCAAGATGA 


ATTAACAl-rr 


CAGAGTTTTG 


2040 




ACCATGTTTA 


TGAAGCACAT 


AACCAATTTG 


AAGATGTCTA 


TATTGATATT 


GTGGCGCAAT 


2100 


SO 


TGGTTGAAGC 


TGCTAATGAA 


AAAGATATTG 


TCTATGCGGT 


TCCGGGTCAT 


CCTAGAGTTG 


2160 




CTGAGACAAC 


TACAGTGAAA 


TTACTGGCTT 


TAGCAAAGGA 


CAATACTGAT 


ATAGATGTGA 


2220 
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ATGATGGCTT CACACTGTTA GATGCGACAT CATTACAAGA AGTAACACTT AATGTTAGAA 234 0 

CGCATACATT GATTACGCAA GTTTATAGTG CAATGGTTGC TGCTAATTTG AAAATCACTT 24 00 

TAATGGAACG ATATCCTGAT GATTACCCTG TTCAAATTGT CACTGGTGCA CXjAAGCGATG 2460 

GTGCGGATAA CGTTGTGACA TGCCCATTAT ATGAATTGGA TCATGATGAA AATGCATTCA 2520 

ATAATTTGAC GAGTGTATTC GTACCAAAAA TCATAACATC GACATATTTG TATCATGACT 25 SO 

TTGATTTTGC AACGGAAGTG ATTGATACTT TAGTTGATGA AGATAAAGGT TGTCCATGGG 2640 

ATAAAGTGCA AACGCaTGmA AcgCTAAAGC GTTATTTACT TGAAGAAACA TTTGAATTGT 2700 

TCGAAGCTAT TGACAATGAA GATGATTGGC ATATGATTGA AGAACTAGGA GATATTTTAT 2760 

TACAAGTGTT ATTGCATACT AGTATTGGTA AAAAAGAAGG GTATATCGAC ATTAAAGAAG 2820 

TGATTACAAG TCTTAATGCT AAAATGATTC GTAGACACCC ACACATATTT GGTGATGCCA 2880 

2^ ATGCTGAAAC TATCGATGAC TTAAAAGAAA TTTGGTCTAA GGCGAAAGAT GCTGAAGGTA 2940 

AACAGCCAAG AGTTAAATTT GAAAAAGTAT TTGCAGAGCA TTTTTTAAAT TTATATGAGA 3000 

AGACGAAGGA TAAGTCATTT GATGAGGCCG CGTIAAAGCA GTGGCTAGAA AAAGGGGAGA 3060 

25 GTAATACATG AGATTAGATA AATATTTAAA AGTATCACGG TTAATAAAGC GACGTACGCT 3120 

AGCAAAAGAA GTAAGTGATC AAGGTAGAAT TACAATAAAT GGTAATGTTG CTAAAGCTGG 31B0 

ATCGGATGTT AAAGTTGAAG ATGTGCTGAC GATTCGCTTT GGTCAAAAAT TAGTAACAGT 324 0 

TAAAGTAACT GCATTAAATG AACATGCATC TAAAGATAAC GCGAAGGGTA TGTATGAAAT 3300 

CATTGAAGAG CGTCGACTTG AAGAAGCGTA AATTGGAGGT GACAAGCAAT GAAAAATAAA 3360 

GTAGAACATA TAGAAAATCA GTACACGTCG CAAGAGAACA AGAAAAAACA ACGTCAAAAA 3420 

ATGAAAATGC GTGTTGTTCg TAGGCGTATT ACAGTATTTG cGGGCGTATT aCTTGCGATA 3480 

ATTGTTGTTT TATCaATCTT GCTTGTTGTC CAAAAACATC GCAATGATAT TGATGCACAG 3540 

GAGCGAAAAG CGAAAGAAGC ACAGTTTCAA AAGCAACAAA ATGAAGAAAT TGCGTTAAAA 3600 

GAAAAGTTGA ATAATCTGAA TGACAAAGAT TACATTGAAA AAATTGCGCX5 TGATGATTAT 3660 

TACTTAAGCA ACAAAGGTGA AGTGATTTTT AGGTTGCCAG AAGACAAAGA TTCGTCTAGC 3720 

TCAAAATCTT CGAAAAAATA AATCCAAATT GATTCAAAAT TATCCGAGTA TAGACATTGT 3780 

GAAAAAA 3787 
(2) INFORMATION FOR SEQ ID NO: 376: 

SO (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1644 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO; 376: 
TAAACCATTT CAAACTGAGG AACGCllAAGA CGGsACgTTT CCAGATTTAG AAGTATTTAA 60 

AAATGAATGT GATTTAAGCT ATGACATAAC GTCACTTTAT ACTTTTAAGC AACCTGTATC 120 

ACCACACCTT GCATTTAAAA TGACAGATCA AATTTTTCTA AATAAGCAGC GTGTATTAGA 180 

TAAGGTAAAA GTTTTAGATA AGGAATTTGA TTTTATCTTA ATTGAGGGTG CTGGGGGAAT 240 

TGCCGTACCA ATATATGAAG GTACAGATGA TTTCTACATG ACTAAAGATC TAATCAATGA 300 

TTGTGCAGAT TGTGTCATCA GTGTGTTGCC ATCAAAATTA GGTGCTATTA GCGATGCCAT 360 

TGTTCACCAA GATTATGTTA ATCAGAATGT ATCGGCGAGT AATTTTTTAA TAATGAATCG 420 

CTATACAGAC AGCTATATTG AAAAAGACAA TCAAATGACG ATTGGAAAAT TAACAAATAA 4 80 

20 AACAGTCTAT ACATTTGAAG AACATGCCAC GTATGAAAAT TTCTCAGAAG CATTTTTAAA 540 

ACAATTAATA GGAGTTAAAA ATGAATTACA CACAACAACT TAAACAAAAA GACTCAGAAT 600 

ATGTTTGGCA TCCATTTACA CAAATGGGTG TATATAGCAA AGAAGAAGCA ATCATCATTG 660 

25 AAAAAGGAAA GGGTAGTTAC CTTTACGATA CGAATGGCaA TAAATATTTA GATGGTTATG 720 

CATCGTTGTG GGTCAATGTG CATGGTCATA ATAACAAATA CTTnAATAAG GTAATTAAAA 780 

AGCAACTCAA TAAAATTGCC CATTCTACGC TGCTAGGATC ATCAAATATT CCGTCAATAG 840 

AACTTGCGGA AAAATTAATC GAAATCACGC CAAGTAATCT AAGAAAAGTA TTTTATTCTG 900 

ATACAGGCAG TGCGTCTGTT GAAATCGCAA TAAAGATGGC ATATCAGTAT TGGAAAAATA 960 

TTGATAGAGA AAAATATGCC AAGAAAAACA AGTTTATAAC GCTAAATCAC GGTTATCATG 1020 

GGGATACGAT TGGTGCGGTA AGTGTTGGTG GTATCAAGAC CTTTCATAAA ATATTTAAAG 1080 

ACTTAATATT TGAGAATATT CAAGTAGAAA GCCCATCTTT CTATCGCAGT AATTACGATA 1140 

CTGAAAATGA AATGATGACA GCTATTTTAA CGAATATAGA GCAAATTCTA ATTGAAAGAA 1200 

ATGATGAAAT CGCAGGGTTT ATATTGGAAC CGTTGATTCA AGGTGCGACA GGCTTGTTTG 1260 

TTCATCCTAA AGGCTTTTTG AAAGAAGTCG AGAAATTGTG CAAAAAATAC GATGTCTTAT 1320 

TAATTTGTGA TGAGGTAGCA GTTGGTTTTG GGAGAACTGG AAAGATGTTT GCATGCAATC 1380 

ATGAAGATGT TCAACCGGAT ATTATGTGTT TAGGTAAGGC GATTACTGGT GGCTACTTAC 1440 

CACTTGCAGC TACATTGACA TCTAAAAAAA TATACAATGC ATTTTTAAGT GATTCGCATG 1500 

50 GTGTGAATAC CTTTTTCCAT GGTCaTACAT ACaCCGGAAA TCAAATcGTT TGTaCGGTTG 1560 

cATTaGaAAA TATaAGaCTT TATGaAAAAC GTaAGTtnAT TGTgCACATa TTGaAACGaC - 1620 
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(2) INFORMATION FOR SEQ ID NO: 377: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 431 base pairs 
<3) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



10 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 377: 

ATGATTTTtA aAAATCATTA AGTTAAGGTr GATACACATC TTGTCATATG ATCAAATGGT 60 

TTCGCCAAAA ATCAATAATC AGACAACAAA ATGTGCGAAC TCGATATTTT ACACGACTCT 12 O 

IS 

CTTTACCAAT TCTGCCCCGA ATTACACTTA AAACGACTCA ACAGCTTAAC GTTGGCTTGC 180 

CACGCmTTAC TTGACTGTAA AACTCTCACT CTTACCGAAC TTGGCCGTAA CCTGCCAACC 240 

AAAGCGAGAA CAAAACATAA CATCAAACGA ATCGACCGAT TGTTAGGTAA TCGTCACCTC 300 

CACAAAGAGC GACTCGCTGT ATACCGTTGG CATGCTAGCT TTATCTGTTC GGGCAATACG 360 

aTGCCCATTG TACTTGTTGA CTGGTCTGat ATCcGTGAGC AAAAACGGCT TATGGTnTTG 420 

2S CGAGCTTCAG T 43j^ 
(2) INFORMATION FOR SEQ ID NO: 378: 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2006 base pairs 

(B) TYPE: nucleic acid 
(O STRANDEDNESS: double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 378: 



TTTnTATAAC 


GTATTATAAA 


TCGTTAAAAA 


TTTTGGTTGT 


GTTTGCGTCA 


CGTAGACAAC 


60 


CrCCATAAAG 


TTACTTAATC 


ACTCTCATCA 


TACAATAATT 


TTTACTCAAA 


TTGGAAnAAT 


120 


TATAAAAATT 


AAATATAGAT 


AGGCTTTGAA 


AATTAGTTTT 


ATACAAGGTT 


AGTAGCTGTA 


ISO 


ACTGTAAAAT 


GTTCTTAATA 


TTGTCAAAAT 


GTAATGCTTG 


AAAGCGCTTT 


TAAAaAATAT 


240 


TATTATATAC 


ATGGTTAGAC 


AAATAGACAA 


ATCACTATAC 


AAATATTGGG AGGAATATTT 


300 


TATGAAATCA 


ACACCACACA 


TTAAACCAAT 


GAATGACGTC 


GAAATTGCAG 


AAACGGTTCT 


360 


ATTGCCAGGA 


GATCCGTTAA 


GAGCTAAGTT 


CATTGCAGAA 


ACTTATTTGG 


ATGATGTGGA 


420 


ACAGTTCAAT 


ACAGTGCGAA 


ACATGTTTGG 


TTTTACCGGA 


ACATATAAAG 


GTAAAAAAGT 


480 


TTCTGTCATG 


GGTTCAGGTA 


TGkGTATGCC 


ATCTATTGGC 


ATTTACTCTT 


ATGAATTAAT 


540 
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CATTGATTTA TATGATGTGA TTaTTkCACA AGGTGCCTCT ACTGATTCAA ATTACGTTCA 660 

ACAATATCAA TTACCAGGTC ATTTTGCGCC AATTGCTTCT TATCAATTAT TAGAAAAAGC 720 

AGTTGAAACA GCACGTGACA AAGGTGTACG TCATCATGTA GGTAATGTGT TATCAAGTGA 780 

TATTTTCTAT AACGCGGATA CAACAGCGAG TGAACGTTGG ATGCGTATGG GTATTTTAGG 840 

TGTAGAAATG GAATCaGCTG CaTTATACAT GaATGCAaTT TACGCTGGTG TCGAAGCATT 900 

AGGTGTGTTC ACAGTGAGCG ATCATTTAAT TCATGAAACG TCAACAACAC CTGAGGAAAG 960 

GGAACGTGCA TTTaCAGATA TGATTGAAAT TGCACTGTCA TTGGTGTAGA TGATTATGAA 1020 

TGTTGAATAT TCTAAAATAA AGAAAGCAGT ACCTATTTTA TTATTCTTAT TTGTATTCAG 1080 

TTTGGTTATA GACAACTCAT TTAAATTGAT TTCTGTAGCC ATTGCTGATG ACTTAAACAT 1140 

ATCTGTAACG ACAGTAAGTT GGCAAGCGAC ATTAGCCGGT TTAGTAATTG GTATTGGCGC 1200 

TGTAGTATAC GCTTCATTAT CTGATGCCAT TAGTATACGC ACACTATTTA TTTATGGCGT 1260 

GATATTAATC ATTATCGGAT CAArTATTGG TTACATTTTC CAACATCAAT TCCCATTACT 1320 

TTTAGTTGGA CGTATTATTC AAACTGCCGG TTTAGCTGCT GCAGAGACAT TATATGTGAT 1380 

ATAtaTTGCA AAGTATCTTT CTAAAGAGGA CCAGAAGACT TACCTTGGCT TAAGTACGAG 1440. 

CAGTTATTCC TTGTCATTAG TTATCGGTAC ATTATCAGGT GGATTTATTT CTACGTATTT 1500 

ACACTGGACA AATATGTTTT TAATTGCATT AATCGTAGTA TTTACXSTTGC CATTCCTATT 1560 

JO TAAATTATTA CCAAAAGAAA ATAATACGAA TAAAGCTCAT TTAGATTTTG TTGGCTTAAT 1620 

TCTAGTGGCA ACTATTGCTA CAACAGTCAT GCTGTTTATT ACGAACTTTA ATTGGTTATA 1630 

TATGATTGGT GCCTTAATTG CGATTATCGT TTTTGCGCTA TATATTAAAA ATGCGCAACG 174 0 

35 TCCATTAGTA AATAAATCAT TTTTCCAAAA TAAACGTTAT GCTTCATTTT TATTTATAGT 1800 

ATTTGTAATG TATGCTATCC AATTGGGTTA TATTTTTACG TTCCCATTCA TAATGGAGCA 1860 

AATTTATCAT CTGcAACTAG ACACAACATC ACTGTTATTA GTACCGGGgT TaTATAGTAG 1920 

CAGTCATTGT TGGCGgCACT AAGTGGgTtA AAATCGGgCG rAATATCTGG AATTCCAAAA 1980 

CCAAGCGGAT TATCACAGCC AATTAA 2006 
(2) INFORMATION FOR SEQ ID NO: 379: 
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40 



45 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4853 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 
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TGGGGAAAAA AAGACCCAGC AGTATTAGAA GAATCGTTAA ATATTTCTAT TGAAGAAATG SO 

AATCGTA7CA TAAAATTAGT CGAAGAATTA CTTGAATTGA CTAAAGGAGA TGTAAATGAC 120 

ATTTCTTCTG AAGCACAGAC CGTGCATATT AATGATGAAA TTCGCTCGCG AATACACTCA 180 

TTAAAACAAT TGCATCCTGA TTATCAATTT GATACGGATC TGACATCTAA AAATCTAGAA 240 

ATTAAAATGA AACCTCATCA ATTCGAACAA TTATTTTTAA TCTTTATTGA TAATGCAATC 300 

AAATATGATG TGAAGAATAA GAAAATTAAA GTTAAGACAA GGTTAAAAAA TAAGCAAAAA 360 

ATAATTGAAA TTACAGATCA TGGAATTGGT ATTCCAGAGG AAGATCAAGA TTTCATITTT 420 

GATCGCTTTT ATCgAGTGGA TAAATCTCGT TCAAGAAGTC AAGGCGGTAA TGGACTCGGA 480 

TTATCTATTG CTCAAAAAAT CATTCAATTA AACGGAGGAT CGATTAAAAT TAAAAGTGAA 540 

ATTAACAAAG GAACAACGTT TAAAATCATA TTTTAATCAT GACTGAGACG TCAATCAAAG 600 

20 TCATAGGATC AATTTTTTAA GTACACATTA GCTGTGACTA ATGTATAAGA ACAACTATAA 660 

AACAAATAAA CAGTGGTTCT TTATCATTTC TGTTGTACTC CCAAAATTTA CAATAAAATA 720 

CATCTATAAA CCTAGAAGAA TCAACGCTTT TGTTGATTCT TCTTTTTAGC AGATAAATAG 780 

GTAAATCTAC TTTAACAAAT AACTAAATAG. TGATATTATT ACATTGTAAG CGTTTCAACA 840 

TTTTTGTGGA GGGTGTAAAA TGACTAACGA AAGAAAAGAA GTTTCAGAGG CTCCTGTAAA 900 

CTTCGGTGCG AATTTAGGTC TAATGTTAGA TCTATATGAT GACTTTTTAC AAGATCCATC 960 

ATCTGTACCA GAAGATTTAC AAGTCTTATT CAGCACAATT AAGAATGATG ACTCAATTGT 1020 

ACCAGCTTTA AAAAGTACAA GTAGTCAAAA TAGCGACGGC ACAATTAAGC GTGTCATGCG 1080 

35 TTTAATTGAT AATATTCGCC AATACGGGCA TCTTAAAGCC GATATTTATC CTGTAAATCC 1140 

TCCAAAAAGG AAACATGTAC CTAAATTAGA GATTGAAGAC TTTGATTTAG ATCAACAGAC 1200 

TTTGGAAGGT ATATCAGCAG GAATTGTTTC AGATCACTTT GCCGACATTT ATGATAATGC 1260 

40 TTATGAAGCA ATTTTAAGAA TGGAAAAACG TTACAAAGGA CCAATTGCAT TTGAGTATAC 1320 

ACATATTAAT AACAATACCG AACGTGGTTG GTTAAAAAGA AGAATTGAAA CGCCATATAA 13 80 

AGTAACGTTA AATAATAACG AAAAAAGGGC ACTATTCAAA CAATTAGCGT ATGTTGAAGG 1440 

GTTTGAAAAA TATCTTCATA AAAACTTCGT TGGTGCAAAG CGTTTTTCAA TTGAAGGGGT 1500 

AGACGCACTT GTACCGATGT TACAACGTAC TATTACGATT GCTGCGAAAG AAGGTATTAA 1560 

AAATATACAA ATAGGCATGG CTCACCGTGG ACGTTTAAAC GTTTTAACGC ATGTCTTAGA 1620 

AAAACCGTAC GAAATGATGA TTTCAGAATT TATGCATACA GATCCAATGA AATTCTTACC 1680 

TGAAGATGGT AGCTTGCAGT TAACTGCTGG ATGGACTGGT GATGTGAAAT ATCACCTTGG 1740 
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AAGTCACTTG GAAATTGTTG CACCTGTTGT TGAGGGGCGT ACGAGAGCAG CACAAGATGA I860 

TACACAACGA GCTGGGGCTC CGACGACTGA TCATCATAAA GCAATGCCAA TTATTATACA 1920 

TGGCGATGCT GCTTATCCTG GTCAAGGAAT TAACTTCGAA ACAATGAACT TAGGAAACXT 1980 

GAAAGGCTAT TCTACGGGTG GTTCATTGCA TATTATTACT AACAATAGAA TTGGATTTAC 2040 

TACAGAACCA ATTGATGGAC GTTCAACAAC TTATTCTACA GATGTGGCCA AAGGTTATGA 2100 

TGTGCCAATA TTCCATGTCA ATGCAGATGA CGTTGAAGCT ACTATTGAAG CAATTGATAT 2160 

TGCAATGGAA TTTAGAAAAG AGTTTCATAA AGACGTCGTT ATTGATTTAG TAGGTTATCG 2220 

TCGTTTCGGA CATAACGAAA TGGATGAACC ATCAATTACT AATCCaGTTC CTTATCAGAA 2280 

TATTCGCAAA CATGACTCTG TTGAATATGT GTTTGGTAAA AAGCTTGTTA ATGAAGGTGT 2340 

CATTTCAGAA GATGAAATGC ATTCATTTAT AGAACAAGTC CAAAAGGAAC TAAGACAAGC 2400 

20 TCATGATAAA ATTAATAAAG CTGATAAAAT GGATAATCCA GATATGGAAA AGCCTGCAGA 2460 

TCTTGCATTA CCGTTACAAG CAGACGAACA ATCATTTACT TTTGATCACT TGAAAGAAAT ' 2520 

AAATGATGCA TTGTTAACAT ATCCGGATGG CTTTAACATT TTGAAAAAGT TAAACAAAGT 2580 

TCTTGAGAAG CGTCATGAGC CGTTTAATAA AGAAGATGGT TTAGTTGATT GGGCACAAGC 2640 

AGAACAACTT GCATTTGCGA CAATTTTACA AGATGGTACA CCGATTCGCT TAACTGGTCA 2700 

AGATAGTGAA CGTGGTACAT TCAGTCATAG GCATGCCGTG TTACATGATG AGCAAACAGG 2760 

TGAAACATAT ACACCTTTAC ATCATGTTCC TGATCAAAAA GCGACATTTG ATATACACAA 2820 

TTCTCCGCTT TCAGAAGCAG CAGTAGTTGG TTTTGAATAC GGCTATAATG TGGAAAACAA 2880 

AAAAAGCTTC AATATTTGGG AAGCACAATA TGGTGATTTT GCAAATATGT CACAAATGAT 2940 

TTTTGACAAC TTCTTATTCA GTTCTCGCTC AAAATGGGGA GAACGTTCAG GATTAACATT 3000 

ATTCTTACCT CATGCATATG AGGGTCAAGG GCCTGAACAT TCATCAGCAA GATTAGAGCG 3060 

40 ATTTTTACAA TTAGCTGCTG AAAATAATTG CACAGTTGTC AACTTATCTA GTTCAAGTAA 3120 

TTATTTCCAC TTATTGCGTG CACAAGCGGC TAGTTTAGAT TCTGAACAAA TGCGACCATT 3180 

GGTTGTTATG TCACCAAAAA GCTTACTGAG AAATAAAACA GTTGCAAAAC CAATTGATGA 3240 

ATTTACTTCT GGTGGATTTG AGCCAATTTT GACAGAATCA TATCAAGCGG ATAAGGTTAC 3300 

AAAAGTTATT TTGGCAACTG GTAAAATGTT CATTGATTTA AAAGAAGCAT TAGCTAAAAA 3360 

TCCAGACGAA TCAGTATTAC TCGTTGCGAT TGAAAGATTG TATCCATTCC CAGAGGAAGA 3420 

GATTGAAGCA TTACTAGCAC AATTGCCAAA CCTTGAAGAA GTGTCATGGG TACAAGAAGA 34 80 

ACCTAAAAAT CAAGGTGCAT GGTTATATGT CTATCCATAT GTTAAAGTGC TAGTTGCAGA 3540 
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AGAAATTCAT AAACTTGTTC AAAATAAAAT TATAGAAAAT GCATTAAAAA ATAACTAGGG 3660 

GGAAATAAGT CATGCCAGAG GTTAAAGTTC CAOAATTAGC AGAATCTATT ACAGAAGGTA 3720 

CCATTGCAGA ATGGTTGAAA AACGTAGGGG ATAGCGTAGA AAAAGGTGAA GCTATTCTTG 3780 

AATTAGAAAC TGATAAAGTT AATGTCGAAG TTGTATCTGA AGAAGCAGGT GTATTATCTG 3840 

AACAACTTGC AAGTGAAGGC GACACTGTAG AAGTTGGACA rGCAATTGCT ATCATCGGCG 3900 

AAGGTAGTGG CAATGCTTCT AAAGAAAATA GTAACGACAA TACTCCACAA CAAAATGAAG 3960 

AAACAAATAA TAAAAAAGAA GAAACAACAA ATAATTCGGT AGATAAAGCT GAAGTAAATC 4020 

AAGCAAATGA TGACAATCAG CAACGTATTA ATGctACGCC TTCTGCGCGT CGATATGCTC 4080 

GTGAAAATGG TGTGAATCTT GCTGAAGTAA GTCCX5AAAAC AAATGATGTG GTTCGTAAAG 4140 

AAGATATTGA TAAGAAACAA CAGGCACCX^G CATCAACACA AACAACACAA CAAGCATCTG 4200 

20 CAAAAGAAGA GAAAAAATAC AATCAATATC CTACAAAACC AGTGATTCGT GAAAAAATGT 4260 

CACGTAGAAA GAAAACAGCT GCCAAAAAAT TATTAGAGGT ATCTAATAAT ACAGCTATGT 4320 

TAACAACATT TAACGAAtTG AcATGACAAA TGTTATGGAA TTGCGTAAAC GTAAGAAAGA 4380 

ACAATTTATG AAAGATCATG ATGGTACTAA ATTAGGATTT ATGTCATTCT TTACTAAAGC 4440 

TTCTGTAGCA GCTTTGAAAA AGTATCCAGA AGTTAATGCA GAAATCGACG GCGACGACAT 4500 

GATTACGAAA CAATATTATG ATATTGGTGT AGCTGTTTCT ACAGATGATG GATTATTAGT 4560 

ACCATTTGTA AGAGATTGTG ATAAAAAGAA TTTTGCAGAA ATCGAAGCAG AAATTGcTAA * 4620 

TTTAGCAGTT AAAGCaCGAG AGAAAAAACT TGGCTTAGAT GATATGGTTA ATGGTTCATT 4630 

TACGATTACA AATGGCGGTA TTTTTGGATC AATGATGAGT ACGCCAATTA TCAATGGTAA 4740 

TCAAGCTGCA ATCTTAGGCA TGCATTCAAT TATTACAAGA CCAATTGCGA TTGATCAAGA 4800 

TACAATCGAA AATCGTCCAA TGATGTATAT TGCATTAAGC TATGATCATA GAATTATT 4858 
40 (2) INFORMATION FOR SEQ ID NO: 380: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2222 base pairs 

(B) TYPE: nucleic acid 
45 (C) STRANDEDNESS: double 

(D> TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 380: 
ATCAGTCACA CGGTAGGCAT ATAAAATGAG TCGTTTCTAC AACATTTTTA AACAGTTCAT 60 
TCAATATTAT TTTTATCTAA TAATnATATT GGGAGGATTA TACCTTTATA CACACCATGC 120 



55 



1276 



ATGCTATTTA GCTAAAGCTA AAAGACCAGA 
GCGATACTTA GTTGCAATTA TTGCCTGTAT 
^ TATCATCGGT ATAATTATTG GTTTAATGAT 

ACTAAAGGTG AGCAAATAAA TTAAGAAAGA 

GTGAGTTGGA ATTTATTCGG TTTTGaTATC 

10 

CTTGTTACGG cGTTTCTTGT TTTTCTACTT 

AGACCAACTG GCAAACAAAA TTTCGTTGAA 

GAAGGTAACA TGGCTTGGAA AAAAGGTCGT 

75 

CTGTACATTT TTATAGCTAA TATGTTAGGT 
ACATTGTGGT GGAAATCACC GACAGCnGAT 

20 ATAATACTGT TAACTCACTT TTATGGAATT 

GGTTATGTAC AGCCGTTTTG GCCATTGGCA 
ACATTAACGC TTGGTCTGCG TTTGTACGGT 

25 TTACTTGCTG GCTTATTCTT TAACGAACCA 

TTAATTGTTT GGCAAGCATT TTCAATATTT 
ATGCTTTCGA TGGTTTATAT GTCACATAAA 

30 

TTATATACAA TCACAGGAGG AAATTAAATT 
GGTTTATCAG CATTAGGAGC AGGTATCGGT 
GGTGTAGCAC GTCAACCAGA AGCACGTGGT 

35 

GGTTTAGTTG AGGCATTACC TATCATCGGT 
TAATTAACAG ATAAAAGAGG TCGGGACAAA 
40 TAGTAATATC TTTGAACTTT ATTAAATAGT 

AAATTCAGTA GGTCCTAACC TCGTCGTTTT 
GAAAGGAGTG TCATGAACCC GTGACTGAAA 
GAGGCGTTGA GTGGGGTACT GTGATTGTAC 
TACTTAAAAA GTTCGCATGG GGTCCATTGA 
TTAACAGAGA TATCGATGAC. GCAGAACAAG 

SO 

AAAATAAACA AAAACTTAAA GAAACACAAG 
AGGTTCAAGC ACGTCAACAG CAAGAACAAA 
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CACTATGCAT ATTTCAACTG GAAATATGTG 240 

GATTTGGTAC CTTAATAAAG CGCATGTAAG 300 

TTCATATGTT GTAGTTATCA TACGTCCTTT 360 

GGTGAGATTA TGGATCACAA ATCCCCGCTC 420 

GTTTTCAATT TATCAAGTAT ATTGATGATA 480 

GcTATCATTT GTACGCGTAA TTTGAAAAAA 540 

TGGATTTTTG ATTTCGTGAG GGGAATCATT 600 

CAATTCCACT TCTTAGCAGT AACGCTGaTT 660 

CTTCCGTTTT CTATAGTAAC GAAAGATCAC 720 

GCAACAGTGA CTTTAACGTT GTCTACAACG 780 

AAAATGCGTG GTACGAAACA ATATCTTAAA 840 

ATTATTAATG TTTTTGAAGA GTTCACTTCA 900 

AACATATTTG CAGGTGAGAT ACTATTAACA 960 

GCATGGGGTT GGATTATTAG TATCCCAGGA 1020 

GTAGGAACAA TCCAAGCATA TATCTTTATT 1080 

GTGGCAGATG AACACTAAAA ATTTCAATAA 1140 

ATGAATTTAA TCGCAGCAGC AATCGCAATT 1200 

AACGGTTTAA TCGTTTCAAG AACAGTTGAA 1260 

CAATTAATGG GTATCATGTT CATTGGTGTA 1320 

GTAGTAATTG CATTCATGAC ATTTGCTGGA 1380 

GCGCATAGGA CATAATTCAT GATGCATATA 1440 

TGAGATATGA ACGCACCATG CCTATCGCAT 1500 

TTTCTATATA ACACTAGCGA TTATTTTAAT 1560 

CAGCTAACTT ATTCGTTCTT GGTGCAGCTG 1620 

AGGTCCTAAC TTTCATCGTG TTAcTTGCGT 1680 

AAGATGTAAT GGATAAACGT GAAAGAGATA 1740 

CTAAGTTAAA TGCACAGAAA CTTGAAGAAG 1800 

AAGAAGTTCA AAAGATTTTA GAAGATGCTA 1860 

TTATTCaTGA AGCAAACGTA CGTGCAAACG 1920 
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TTAATAATCa AGTATCTGAA CTATCAGTGT TAATTGCTTC TAAAGTTCTT AGAAAAGAAA 
TTTCTGAACA AGACCAAAAA GCATTGGTTG ACAAGTATCT AAAAGAGGCA GGCGATAAAT 
AATGGTAf^ GTAGCTAACA AGTATgcTAA AGCATTATTT GACGTGTCAT TAGATACAAA 
TAATTTAGAG ACTATTAATG AAGAATTAAC AGTTATAAAT GAAGCAGTAA AAGATAAAAT 
TG 

(2) INFORMATION FOR SCQ ID- NO: 381: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1143 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 381: 
TAACAATTCC TaTATTCATG TTTAATACGA AACACTACAT TTACATTGTA ATTCACTATC 
TTTTGAAGTA ATAAAGTGAT TTGTTCAATC GATAGCTCAT TGCTTGTGTC GATTGTAACA 
ATTATATGCA AGTTTTCAGG ATTAACACCT AATCTTTGAA TGATTTGTTT AATAGTATAA 
TAATCCATCC AATAAAAATT ACTTCCTTTA ATATAAATGT TTTTAGGTTG ATACATTTGA 
CTCCTTTTTG TAGGCTCAAA AGGTATATCA ATCTCGCGCA TACTTGAAGA ACTTTGATTA 
GTATCATCAA ATAATTCAAT TATATTTTTA TCAATTTCAA CTAATTGGGA ATGGTTAATT 
GAATGAGATG TTGGACTATA TCTTTTTCTA ATTAATTTAG GAGTGTTACC ATACGTTTCT 
TTAAAGAGGT GTATAAAACG AGAATAATGA TTAAAACCAT GACTACTIGC GATTTCTTCA 
ATAGGCTTCT TAGrAGTTAA AATATCAATT AAGCAATGCT CCAGTCTAAT ATGATTTAAA 
TATTGAATAA AATTACTATA AGGTGTCGCT TTAAACATGT CACTTAAAGC TTTGTTTGTA 
ATACTAACTT GATTAATGAC ATCTTTCCTA TTTATCTTTT TATGGTGGTT GTTTGTTAAA 
TAATCGTGCA CTTCTTCGGC TACTAAATGA CGACTACCAT CGTATGTATT TAATGACATT 
AATTCAACAC ACATGTAATT AATAATCTTA TCATTAGCAT TATAAGACTG TTGTTTAATT 
TTGCTGTAGA TTAAATACTT AATCAAGATT CTAAAAGTGC TAGCAACCTC ATTTGTTAAT 
ATCTTGCCAC GCATCATATA GTTTGCATTC ATAAACTTCA AAAATGTCTT TGCACTTACT 
TCAACAACAC AACATACACT ATCATCATTA CCATCAATTT GATACAAATC ATTCAACATA 
ATAATGGTGA CATCATTTCT TTTTACATCA TATTGTTGTA GATTGATTGA AACTACACCT 
GTACCTTGTA GCCAATATAT AATTTTtAAG TTCGCTTCCT TCACACTACT CATTTTCATA 
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ATT 

(2) INFORMATION FOR SEQ ID NO: 382: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 506 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 382: 
GGACCACCTT TTTTACCTGT ACGACTAAAG CCAACTGTTT TAAAGGCACC AACAGCATGC 
CACACTTGAA TAATTTCTrG TGATGGTCTA AAGCGAACCG TATAAATTAA TGGATGGAAA 
TCATCAACAA AAATATAATC GGCCTTACCA AGTAAATATG GCAATCTAAA CTTGTCTCTC 
CATTTGCGTC TATCCGTAAT ATTCTCCTTA AATACCGTTT TAATATCATA ATCAAAATCT 
ACTTTTTGGC GTAGTAACTC ATCATATACA TACTTGAAAT TCCCTGATAA ATTCGGACGC 
GAATCTGATG TOAATAATAT TGTTTTGCTT CTTTTAATAT GTAGTAACTT TGTAATATTA 
AAAATAGCTT TAAATAAGAA ACTTCTACTT TCAAATGAAG CTTTATGaCC TTGTTTaTGA 
AGCCAGTGTG cACTTgTCGC AATGaCCCCT GaTTTCyCyT GagGtAAGGk GaTTTCniATA 
TCAAATACAA ATTCGTTAAC GTCACT 
(2) INFORMATION FOR SEQ ID NO: 383: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 421 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 383: 
AGCATCTGCA AtGAGTcTCT AATACAACGA TACGTTTTGC ATCTTTAGGT ACTTTTACTG 
TACCATTTTC ATCTTTTACC GAAATAGTAT CTTTAGTTGA TGATTCTTTT TTACTTGAAT 
TATCCGTATT ACCACAAGCT GCAACTAAAA GTAAGGCAAC TATTAATCCC AATATACTAA 
AAGTTTTTAG ACCTCTCATC GTTCCACTCC TTAATATGTA TAACTTCATT TATTATTTTA 
TTGATAACAA TTATCATTGT CAAGTAGCGT TCAATCTTTT TTATATTTCT AAAATGTATG 
ACTATATATT- TCCTCTAATA ATTATGACTA CAATTAGCAC ATTTCCTTAG ACAAAATACT 
GATAATGTAT CATTGCTATA TCATCTTTGC ATTAATACAA TTGACACCAT TTAGCATGAC 
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(2) INFORMATION FOR SEQ ID NO: 384: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 862 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 384: 
TGCACTTGAT ACTTTAGCAC ATGAAATTGC TAATCGATTA GTTGCAAATG ACAAGAATGA 60 
AGCAACTTTG GAAATGACTA ATAAAATGGC AACGATTCGT TTTACAGAAC CTACGCTGAT 120 
TGCATTAGCA GGGGGTAATG TCAAAGCTTA CACTGAGCAT ATGACTATAT CTCCATATAA 180 
ATTGTATTTG TTAGATAAAG GCGATGTTTT AAAGTTTAGA GAAACAAGTT ATACATCGCG .240 
AGTGTATTTA GCTGTgGGAG GCGGATTTGA ATTAGATGCA TGGTTAGGAT CTAACTCAAC 300 
CGACTTTAAT GTAAAAATTG GTGGTTTTAA AGGTAGAACA TTACAAGATG GCGATGAAAT 360 
AAAGCTTAAG AGAGATTATA CAGCTCGTCA TCATAAGTTA TTTGAAAACC TTGCTCACAC 420 
25 GAAACAAACA GATTGGGGTA TTGATGGATA CGCCTTGTCA TTTAATTATA TGTCTGATGT 480 
ATTTCATGTC GTTAAAAATA AAGGTACGGA AGATTTTAAA GAAGATGCCA TTCAAAGATT 54 0 

TGTGAAACAT GATTATAAAG TAACGAGCAA AGCAAATCGC ATGGGGATGA TGCTTGAAGG 600 
TGAAAAAATC AAAGCTTTTT ATGAAGATAT GCCACCGTAT CAGACTGTCA AAAAAGGAAC 660 
GATACAAATT AAGCGTGATG GCACACCTAT TATCCTATTA AATGATCATT ATACGCTAGG 720 
TAGCTACCCG CAAATCGGTA CAATCGCAAG TTATCATTTA ACGAAATTAG CACAAAAACC 780 
GCAAGGATCA CGTTTGAAAT TTCAATTTAT AGATATTTTA ACGGCTGAAA AGAACCTTGT 840 
TAAgTATAGT AACTGGTTAA AC 862 
(2) INFORMATION FOR SEQ ID NO: 385: 

40 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1027 base pairs 
(B> TYPE: nucleic acid 
(C> STRANDSDNESS : double 
45 (D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 385: 
AAATGAGTTG ATGATGGCTC CTATTCCATC TATCTCTAGG TATGACAGAA SATAAACGGT 60 
CTTCTACCTG TCTsACATTA TCTTTCCAAC GATTAATACC TAAGCGTTTA GAAACACGTT 120 
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CAGTTTTACG TCCTACACCT GCTAAACTTT CTAATTCCTT ATGTGTTTGT GGTATTTCTC 
CATTAAATTG ATCAATCAAA GATTGACAAA GTTTCTTAAT ATTCTTAGCT TTGTTACGAT 
ACAGACCGAT AGAACGAATA TCATTCATAA GTTCTTCATC ACTGACTGCC AAATAATCTT 
CAGGCGTTTT GTATTTTTTA AACAGCTCAG TTGTTACTCT ATTTACTAGA ACGTCTGTAC 
ATTGCGCTGA CAATAATACA GCAATAGTTA ATTCGAACGG ATTATCATGT TTTAATTCAC 
ATTCTGCATC CGGAAACATA TTTGCTATAA CATCAATCAT TTCTAATGCT TTTTTCTTAC 
TTACCATCAA GGTTCTCCCC GTTTAACCAA TCAAATTTAG GTACCGTTTT AACTGTGTGC 
GTCATTTTCG GTTTATTGAA TTTTTCTCTT ATTTTTCTAG AATCGTCAAT TGTTTTGACA 
TTGTTTTTCT TCCAATTAAG TAAAATAOGA TCTATATATT TAAAGCTAAG TTTATTCAAA 
CTATTCGCCT CGTCTAATGC CGCTTGTATA ATTGCAGTAT CGTGTTTATC AACATCAATC 
CATTGATTTA ACGTTTCTAT TTCATATGGA GATAACGGCC TTGCAAATGT ATCCTCTAAA 
ACTCTAAATA ATTGTTTAAA TTTTTCTTTA CTATTTAGCT CTTTCGTTTC CATACTTTGT 
TGCTTCAATA TATGACTTAA TTTTTCGAAA AAAGGATCTA GATTCATATA TTCGGkAAAT 
CTACCTTCyT CATCyTTTTG aACTkGtAAT tCTAGCAATT CAOGTgTATC AAATTTTGGA • 
TACCATT 

(2) INFORMATION FOR SEQ ID NO; 3 86: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1006 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 386: 
AAGGnTTGGA GGGAATTAAT nGATGGCAAA TCCCAGaTAA AGTACACaAC GCATGGAATG 
TGATGCATTT AATATTTCCA GTAGTTAGTA CGACGTTTGC AAGCTTTAAA TCTATGTATG 
GGGGCATACC AAAAGATTTC ATAGACTACT TATTTATTGA TGAAGCAGGA CAAGCAATAC 
CTCAAGCAGC TGTGGGAGCA TTATATCGTT CAAAAAAAGT TGTAGCTGTA GGTGATCCGA 
TTCAAATAGA ACCGGTTGTG ACTTTAGAAA GTCATTTAAT TGATAACATT CGTAAAAATT 
ATCATGTTCC GGAATATCTA GTTTCTAAAG AAGCTTCTGT GCAGTCTGTT GCAGACAACG 
CCAATCAATA TGGTTTTTGG AAATCTGATG CTACTGATAG TAATCAAAAA ACCTGGATAG 
GCATACCTTT ATGGGTGCAC AGACGATGTT TAAAACCTAT GTTCACGATa GCTAaCCAAa 
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GGTATGACGT TAAAGGAAaC GCAGTTCAAA AACAATTTGT GAAAGAGCAT GGTGAAAAaG 
TAiGTGGGATT ATTAGCTGAT GATTGGATTG* AAGCAATTAA GGAAGGTAAA AATGAACCGA 
GCTCATTTGT AATATCGCCT TTTTCAGCAG TACAGCAACA GATTAAACGT ATGTTAAAGC 
AACAACTACC GACTAGAATT GATATTGAAC GTACAAAAAT TAATCAATGG GTCGATAAAT 
CCATTGGTAC TGTTCATACT TTTCAAGGTA AAGAGGCTCA GAAGGTGTAT TTTGTAATAG 
GTACTGATAA TACCCAAGAT GGTGCTGTGA ACTGGTCATG CGAAAAACCA AACTTGTTAA 
ACGTTGCAGT GACAAGAGCT AAGAAAGAGT TTaTGTAATT GGCGACATGC AAAGAATACA 
GATGAaACCA TTTTATGAGA CGATTTTTAn AGnAAGAAAT GTAAAA 
(2) INFORMATION FOR SEQ ID NO: 387: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 662 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNSSS: double 

(D) TOPOLOGY: linear 

. (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 387: 
CGTTTCATCA AGTnATCGAT CCTAATTTAC AAAATATTCC GGTTAGACTt GAAGAAGGGC 
GTAAAATAAG AAAAGCCTTT AAACCAACTT CAAAAGATAG CGTTATATTA TCAGCAGATT 
ATTCrCAAAT TGAATTGCGT GTATTAGCAC ACATTACACA AGATGAGAGT ATGAAAGAAG 
CATTTATCAA CGGCGATGAT ATTCATACAG CAACTGCTAT GAAAGTATTT GGTGTAGAAG 
CTGATCAAGT CGATAGTTTA ATGCGTCGTC AAGCAAAAGC AGTTAACTTT GGAATTGTTT 
ATGGGATAAG TGATTATGGT TTAAGTCAAA GTTTAGGTAT TACTCGTAAA AAAGCAAAAG 
CATTCATTGA TGATTATTTA GCTAGTTTCC CAGGTGTAAA ACAATATATG TCTGATATTG 
TAAAAGATGC CAAAGCTTTA GGTTACGTGG AAACATTGCT ACATCGTCGA CGCTATATTC 
CTGATATTAC GAGTCGTAAC TTTAATTTAC GCGGCTTTGC TGAACGTACT GCTATGAATA 
CGCCAATACA GGGCAGTGCT GCAGATATCA TTAAACTGGC AATGGTTAAA TTTGCTCAAA 
AAATGAAAGA GACAACATAT CAAGCTAAAC TATTATTACA AGTACACGAT GAATTAATTT 
TT 

(2) INFORMATION FOR SEQ ID NO: 388: 

Ci) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 669 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 3B8: 

g TCATCCAAAT TTTGGAAATT CCACATTTTA CATATCGTAA TTTTTTAGGA AACTAGTGAA 60 

TATAACAAAT CCCTCCTCTC ATTTTTAAAA TAGATATATC ACTTCCCCAC TTTTACTTAA 120 

CTAAACTGCA ACGGTTCCTA ATACCAAAAT CCTGCCCTCT ATTTTTATCA ATTCAAGCAT 180 

10 ACTTATTGAA AAATGTTAAC GTTTTCTTGA TAATCATTGT AAGCGCATTT ATTTTATAAA 240 

CTAACGTTTG AAATATACTA CAGGAGTGAC ACGTAATGAC TCAAATTACT GAAAAAGAAT 300 

TAAAAAAGAA GTATTTAGAT TTACTATCCC AAAATTTTGA TACTCCAGAA AAACTTGCAA 360 

CTGAAATTAT CAATTTAGAA TCAATTTTAG AATTACCTAA AGGTACGGAA CATTTCGTCA 420 

GCGATTTACA TGGTGAATAT GAAGCTTTCC AACACGTATT ACGCAACGGT TCTGGGAACG 4 80 

TGCGAGCGAA AATCAATGAT ATTTTCAAAG AGAGACTTTC AACTAAGGAG CTTAATGACT 540 

20 

TAACTGCTCT TGTCTACTAT CCAGAAGrCm AATTtAAAAT TgATTAAAAG TGATTTCCAA 600 

AATTgCGGtC mACtTAATGt CyGGtATATC ACaACmATCG aACATTTAAT TGAGTTAATT 660 

AAATATTGT 669 

25 

(2) INFORMATION FOR SEQ ID NO: 389: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 124 9 base pairs 
30 (B) TYPE: nucleic acid 

• - (C) STRANDEDNESS : double 
(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 389: 

CACATGGCTG TTAGAGATAT GAATGGCCAT GCGTTACCTT TAACAAAAGA TGGCAATTTT 60 

TATCAAACGA ATGTAGATGC AAATGGTGTT AATCATGGTG GTAGTGAAAT GGTGCAAAAT .120 

40 < 

AAAACAGGTC ATATGAGTCA ACAArGCCAT ATGAATCAGA ACACACATGA ACCAACAGCC - 180 

— - . ■ - V ' V 

ACACATGCAA CAAGGTCATA TGCAATCATC AAACCATCAA ATGATGAGTC CAAAAGCAAA-- 240^ • 

TATGCATTCA TCAAATCATC AAATGAACCA AAGTAACAAA AAAGTTTTAC CAGCTGCTGG 300 

45 

TGAAAGTATG ACATCAAGTA TTCTTACTGC AAGTATTGCC GCACTACTAT TAGTATCTGG 360 

GTTATTCTTA GCATTTAGAC GACGTTCAAC AAATAAATAA ACATAATACG ATTAATAATA 420 

SO GAAAAATCGT GTGATTATCT GaGGGAGCCT AGGACATAAA TCAATGTCCT AGGCCCnCTA 480 

AtGTTATATT GGCAGTAGTT GACTGAATGA AATTGCGCTT GTAACAAGCT TTTCCATTTC 540 

55 
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CGATTGTCTT ATACGTGTCA 
AATCATAATT GGATAAGGTG 
ATCACCaTCA AACACGTGAC 
TAAATCTGAT TGATATGCAT 
TTCGTTTTGT GTATTCACTT 
AAATGCATCA GCTTGCTTAG 
GACGGCAGAA GGATGGTTTG 
ATAATTAATT GATGACATAG 
TTGATCCATA CTTGAAGCGT 
TCTTGTACTC TCTACGATGC 
ACGACTGGAC ATCAAAGCGC 



GTGTTAATTC AGATATTTCC 
CTTGTGCGTA CAGTGTTTCA 
TATGATTTTJc GAAGTGGGGC 
TGCTATAAAT CGTTTGCTCA 
TAAATGTGTC AATGACATTT 
AATGATTGTC CTTTTTTTGA 
CAAACAAATG ATTTGTATAT 
ATACGCGAGC TAGCAATATT 
GTTGGGCATT TGTTTGTGGA 
CATCTTCGGC TAACAATTTt 
GCACAAAGTT CCTTTTCAGT 



TGTGGAATAT ACCACTTATT 
ATAATCAGCC AACAATGTGT 
GCTTTGGTAA TAGACATTTT 
ACGAATGTCT TCATGTCGTC 
AACGGTATAA AGGTAAAGCA 
TAATAGCGTT CCATTGCAAT 
TCACTTTCTA AATCAACACG 
TGATCAAGTG GATGCTTAAA 
ATAACAAAGT GTCCCTTCCC 
ATAGCTTGGC GCAAAGTCAT 
AGGTAATGC 



(2) INFORMATION FOR SEQ ID NO: 390: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1788 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 390: 

AATGATGATT CATTCAAAGA AATTAACGCT CGGTATATGC TTGGTATTAC TCATTATATT 

GATTGTAGGT TATGTCATTA TGACAAAAAC AAATGGTCGA AACGCCCAAA TTAAAGACAC 

ATTTAATCAA ACATTAAAAT TATATCCAAC CAAAAATCTC GATGATTTTT ACGATAAAGA 

AGGCTTTCGA GATCAAGAAT TTAAAAAGGG TGATAAAGGT ACTTGGATAG TTAATTCTGA 

AATGGTAATC GAGCCAAAAG GTAAGGATAT GGAAACGAGA GGAATGGTGC TCTATATCAA 

TCGCAATACT AGAACCACAA AAGGGTATTA TTTTATAAGT GAAATGACAG ATGACAGTAA 

• - • * ■ * 

CGGCAGACCA AAGGATGATG AAAAAAGGTA TCCGGtAAAA ATGGAACATA ATAAAATCAT 

ACCAACGAAG CCACTACCGA ATGACAAGTT AAAAAAAGAG ATTGAAAACT TTAAGTTCTT 

TGTACAATAT GGCAACTTTA AAGATATTAA TGATTATAAA GATGGTGATA TTTCATATAA 

TCCTAATGTA CCAAGTTATT CGGCAAAATA TCAATTGAAT AATGATGATT ATAATGTCCA 

ACAGTTaAGa AAAAGATATG ATATTCCAAC CAAACAAGCG CCGAAACTAT TATTGAAAGG 

CGATGGAGAT TTAAAAGGTT CATCCGTAGT TcTAGAAGTC TTGAATTTAC CTTTGTCGAA 
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10 



IS 



20 



2S 



30 



35 



AGGTATGAGT CAAACTGAAT ATCAAATAAA ACCTGGTAAT ATAACAAGTA ACTCTGAAGA 
AACAAGTTCG ATATCTAAAG TGAGCTGTGA AATATAGGTA GCCATTTCAA AAAATTTAAA 
GGTGAATTTG ATAATGTAGC TCAAGGAiSAT TGGGTTAAAA AGGCGAAGAA TGAACTGGAT 
GATATTAGTA AGAAATTAAA AAATATTCAA AGAACGGAAG TTTAATAGCT TATATGATTC 
TTGGAGCTAA GACAGCATGC GTTCATTCAT GCCATTATTA ATATAAGCAC CGCAACAAAA 
AAGCTTCTAA TGTGATACAG GAACCTCATA TTCCGTATCA TGTTAGAAGC TTTTAATGTC 
TAAAGAACAT CTACATTTTA TCATATTTTC TGACTTATTA AACTTTTATA TAATTAAATA 
TTTCTTAATT TTCCAAAATA GTGATAAATT TGTGAAATAC ATCACAAATC CCTTTATTTA 
TTTGGAAATT CATGTAATAT TAGACTTGTA AGAAGTTAAT AAATAGAGAG AGACGAGAGA 
GTTTATATAA ATACTATATA AACATTGGAG TGATGATTAT GAGAAAAGAG ATTGAAGCGC 
TTATTTTCTC AGACGTAAtA GCTATGATAT TTACGTGAAC ACTGGTGTAA ATCAAGGATT 
AATTGGTGAC ATCAAAGATG GTTACCTAAC TATTGATTCT ATGCCTTACA TTGATGCTGA 
GCGTTTGTAT CACTTTGCTA TGGAACGTAA ATCGTTAGTC ACTAACTAGT TCTTATTGCC 
AATGATTACT ACCCCTAGTC GGCGGCAATT GAAGTGTGAT TGATGTAACT TGCCCTCGTT 
GGTGAGCAAT TGAGGGCAGA CCCCnTAAT TAAGTAAACC CTAACTCCCC ACAAATCTGG 
AACGATACTA AAAGCCACGT CCTATAITGG ATGTGGCTTT AGTCAkACTT ATATTATTTT 
tAAAACGATT ACCTACAAGA TTTACATATA AAATTCTATC ATGnCTGC 
(2) INFORMATION FOR SEQ ID NO: 391: 
(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 24 07 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNSSS: double 

(D) TOPOLOGY: linear 



840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1788 



40 



45 



SO 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 391: 
GCAAGTTTAG TTAAACAGAT ATTAAAACCA GATCAATATA CAGATGCAAA TTCTCTATTA 
GAGATTAGTT TGCAAACAGG TATGTTTATT GCAGGTGGAT TATCAGGAAT ATTATATAAA 
ATAAATGGAT TCACTCTAAT TATAGCGATG ACTATAATGA TGTTTCTAAT CAGCATTTTT 
ATGTTATTTA GATTGCATGT AGATAAACCA ACTCATTCAG AGGAAGAATC AACAAATAGC 
TTATTGCAAG AATATTTATT AGGATGGAAA TTTTTAAAAG ACAACATGAT GATATTTATT 
TTTGGAGTTA TTTCAATCAT ACCAATGGTG TTTACAATGA TCTTTAACAT ATCATTACCA 



60 
120 
130 
240 
300 
360 



55 
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TATGGCATTG GAGGATTATG TGCAGGTTTA ATTTCAGCTA TTCTTTCGAA GAAAATCTCA 480 

ACTAAAGTAT TGATATTTTT GTTATATTTC ATATTAGTCA TAAATTCAGC ACTATTTATT 540 

^ TGGATAAACT CAGCATTTTA CTTATTCATA GGATCATTTA TACTAGGCTA CTCAATTTCA 600 

TCAATCAGAA TTTATATGAA TACAGCTATA ATGAACACTG TTTCAGATAA ATATGTCGGT 660 

CGCTCATTTA CGATATGGAC GTCAATTTCA TTGTTACTGC AAAGTTTAAT TGCTCCATnT 720 

TO 

TTAGGAAGAT GGATTAATGA AATTAATGAT AAATTCGGTT TCTATATTAT ACTCATTTTA 780 

TCCTTACTCA TATTTGTaCA CTGCTGCTTG TTAACAAAAC AGACAAAATA AAATATGCAC 840 

ATAAAGAAGA GTGACCGTCA CTCTTCTTTA ACAAGCGACC ATTTATCGaT GGGCTTAGTT 900 

CTCTCTGCAC CCACACTTCA CTACTTCACT TTTTCAAATC ATTTTTTATG GTCTTAAATA 960 

AATCAGTGAG ATTTGTTGCT TCGGTAAAGT CTAGAATTAA TATCATTTCT TTAGAACCTG 1020 

GATATGGCGA AACTAATGTA TTATCTTGCA ATTTCTGCTG GGCA CT TT TA GTCGCCTTGA- 1080 

20 . ■ 

CCAATAATCT ATTATCATAC AAACCACCTA TAACCACGCC ATCATAATAA ATAATATATT 1140 

CTCCCATCAT CTTTCTTGTC TTAACCGCGT TTGAATTCAC ATGATTTAAA AATAAATCAT 1200 

25 GTACATCm CTTAGTCGCC ATTGTAATCG CTCCTTCAGT TTTATGTTTA ATCACATTCG 1260 

TATTAATGAT TCATTTCGTG TTGCTCTTAA TTTTATCTAT AATTATATGC GTAGTTAAAA 1320 

TCAAACCTAT GGAAAAGAAA ATAATGATAA CAATGTTAAG AAATATAGTT ATAAAATTAT 1380 

30 AGTTTGGAAG GTATGCGAAT AGCAGAAAAA TAGGTATCGC AAAAAATAAA TCCCACCAAC 1440 

■ . . -. . 

CTAAACTTTT TAAAGAATGC TTTAAACCTT CCATAATATC ACCTTTATAA ATTTGTCTTT 1500 

GTTATAAGAT AACTAAAAAA TCGCTTTACT GTAAAAGTAG CCAAAGAAAA TTCTGAATCA 1560 

35 

TATTCATAAG TAGTGTATCA TTAATAATGA ACAATTTAAT ACTATAATCC TTGATCTTTG 1620 

TATTGATCAA CTTACCACAA CATTTATTTT AGACTACTCT TAGACTTCCC TTTCAAATGG 1680 

TTGCATCTAT TGAAATTCCT TTTGTATAAG TTAGGCTTTT GTGGTAATAT CATCATGCAT 1740 

40 

AAAAAATCGA GATACTAATT ATAAAGAGGG TATAAATATA TTATGAAAGA AAATTTTTGG 1800 

AGTGAATTAC CACGTCCATT TTTTATTTTG GCGCCAATGG AAGACGTTAC AGATATCGTC 1860 

TTTCGACACG TTGTAAGTGA AGCAGCTAGA CCGGATGTGT TTTTCACTGA ATTTACAAAT 1920 

49 

ACTGAAAGCT TTTGCCACCC TGAAGGCATA CATAGTGTGC GCGGACGCTT AACTTTTAGT 1980 

GAAGATGAAC AGCCGATGGT CGCTCATATA TGGGGAGATA AGCCAGAACA GTTCCGTGAA 2040 

SO ACGAGTATTC AATTAGCTAA AATGGGCTTT AAAGGCATAG ACTTAAATAT GGGATGTCCT 2100 

GTAGCAAATG TTGCTAAAAA GGGTAAGGGT TCCGGCTTAA TCTTAAGACC TGACGTTGCT 2160 

55 
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GGCTACTATG AAATCGATGA ATGGAAAGAT TGGTTGAAGC ACGTCTTCGA ACAAGACATT 2280 

GCCAATTTAT CTATTCATCT TCC3TACACGT AAAGAAATGA GTAAAGTAGA TGCACATTGG 2340 

GAATTAATCG AAGCTATTAA AAATTTACGT GACGAAATTG CACCAAATAC ATTGTTAACA 2400 

ATTAACG 2407 



(2) INFORMATION FOR SEQ ID NO: 392: 

10 

ii) SEQUENCE CHARACTERISTICS": 

(A) LENGTH: 2424 base pairs 

(B) TYPE: nucleic acid 

. (C) STRANDEDNESS : double 
(D) TOPOLOGY: linear 

15 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 392: 
ATGATGnATG GCnCCGCCAA GAAGTTGAAC CAGTCTATTG GCTAGAATTG CTCAAAAAGC 60 
GAGAcaTGTG GTATTCaTAT GTTaGTAgCt ACGCAAAQAC CATCTGTCAA TGTAATTACA 120 
GGTTTAATTA AAGCCAACAT ACCAACAAGA ATTGCATTTA TGGTATCATC aAGTGTAGAT 180 
25 TCGAGAACGA TATTAGACAG TGGTGGAGCA GAAGGCTTGT TAGGATATGG CGATATGTTA 240 
TATCTTGGTA GCGGTATGAA TAAACCGATT AGAGTTCAAG GTACATTTGT TTCTGATGAC, 300 
GAAATTGATG ATGTTGTTGA TTTTATCAAA CAACAAAGAG AACCGGACTA TCTATTTGAA 360 
GAAAAAGAAT TGTTGAAAAA AACACAAACA CAATCACAAG ATGaATTATT TGATGaTGTT 420 
TGTGCATrrA TGGTTAATXiA AGGACATATT TCAACATCAT TAATCCAAAG ACATTTCCAA 480 
ATTGGCTATA ATAGAGCAGC AAGAATTATC GATCAATTAG AGCAACTCGG TTATGTTTCG 540 

35 

AGTGCTAATG GTTCAAAACC AAGGGATGTT TATGTTACGG AAGCAGATTT AAATAAAGAA 600 
TAATTATGAG TAAGGAGTTT TATATAATGA CACACTATCA TTTTGTCGGA ATTAAAGGTT 660 
CTGGCATGAG TTCATTAGCA CAAATCATGC ATGATTTAGG ACATGAAGTT CAAGGATCGG 720 

40 

ATATTGAGAA CTACGTATTT ACAGAAGTTG CTCTTAGAAA TAAGGGGATA AAAATATTAC 780 
CATTTGATGC TAATAACATA AAAGAAGATA TGGTAGTCAT ACAAGGTAAT GCATTCGCGA 840 

^ GTAGCCaTGA AGAAAtAGTA CGTGCACATC AATTGaAATT AGATGTTGTA AGTTATAATG ' 900 
ATrmTAGG ACAGATTATT GATCAATATA CTTCAGTAGC TGTAACTGGT GCACATGGTA 960 
AAACTTCTAC AACAGGTTTA TTATCACATG TTATGAATGG TGATAAAAAG ACTTCATTTT 1020 

SO TAATTGGTGA TGGCACAGGT ATGGGATTGC CTGAAAGTGA TTATTTCGCT TTTGAGGCAT 1080 
GTGAATATAG ACGTCACTTT TTAAGTTATA AACCTGATTA CGCAATTATG ACAAATATTG 1140 

55 



1287 



EP 0 786 519 A2 



10 



IS 



20 



25 



30 



35 



40 



TGGCACATAA TGTTAAAAAA GGTATTATTG CTTGGGGTGA TGATGAACAT CTACGTAAAA 
TTGAAGCAGA TGTTCCAATT TATTATTATG GATTTAAAGA TTCGGATGAC ATTTATGCTC 
AAAATATTCA AATTACGGAT AAAGGTACTG CTTTTGATGT GTATGTGGAT GGTGAGTTTT 
ATGATCACrr CCTGTCTCCA CAATATGGTG ACCATACAGT TTTAAATGCA TTAGCTGTAA 
TTGCGATTAG TTATTTAGAG AAGCTAGATG TTACAAATAT TAAAGAAGCA TTAGAAACGT 
TTGGTGGTGT TAAACGTCGT TTCAATGAAA CTACAATTGC AAATCAAGTT ATTGTAGATG 
ATTATGCACA CCATCCAAGA GAAATTAGTG CTACAATTGA AACAGCACGA AAGAAATATC 



45 



CACATAAAGA AGTTGTTGCA GTATTTCAAC CACACACTTT CTCTAGAACA CAGGCATTTT 

TAAATGAATT TGCAGAAAGT TTAAGTAAAG CAGATCGTGT ATTCTTATGT GAAATTTTTG 

GATCAATTAG AGAAAATACT GGCGCATTAA CGATACAAGA TTTAATTGAT AAAATTGAAG 

GTCCATCGTT AATTAATGAA GATTCTATTA ATGTATTAGA ACAATTTGAT AATGCTGTTA 

TTTTATTTAT GGGTGCAGGT GATATTCAAA AATTACAAAA TGCATATTTA GATAAATTAG 

GCATGAAAAA TGCGTTTTAA TATGTTTATA ATAGAGTAGT ATGGGTATTT ATTATTAATG 

ACATTATTAC ATGTTAATTA GGAGGCGTTT TTAATGGATT GGATTTTACC AATTGCTGGA 

ATTATCGCTG CGATTGCATT CTTAATTTTA TGTATCGGTA TCGTAGCTGT ATTAAATTCT 

GTTAAGaAAA ACTTAGATTA TGTTGCAAAA ACACTTGACG GTGTAGAAGG TCAAGTTCAA 

GGTATTACTC GTGAAACAAC AGATTTACTT CATAAAGTAA ACCGTTTAAC TGAGGATATC 

CAAGGTAAAG TAGATCGTTT AAACTCAGTT GTAGATGCTG TTAAAGGTAT CGGTGACTCA 

GTACAAACGT TAAACAGCTC TGTAGATCGT GTAACAAATT CAATTACACA TAATATTTCT 

CAAAATGAAG ATAAAATCTC ACAAGTTGTT CAATGGTCAA ATGTTGCAAT GGAAATTGCA 

GACAAATGGC AAAATAGACA CTAC 

(2) INFORMATION FOR SEQ ID NO: 393: 

(i) SEQUENCE CHARACTERISTICS: 
• : (A) LENGTH: 738 base pairs ■ 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : doilble 

(D) TOPOLOGY: linear 



1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 
1920 
1930 
2040 
2100 
2160 
2220 
22B0 
2340 
2400 
2424 



SO 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 393: 
CnATAATATT CnTCAAnCCT TTAAATAGAG GAATAGACTG CCGACAGAGT CCGAGACTTT 
GTGGGTAGTT TTTTTAGTTT TGATAACGGA AGTTAGAGGC TCTCTGTCAA ATTGGGCAGA 



60 . 
120 



55 
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AGTGTAAAGT TTTCAACATA ATACTATTAG TTCGGTCATG TATCGGACTG ATGGAAAAGC 240 

GTTTCACTTT TAATGACTCA TTAAGAACX3G CCTGAAAATG TTTGGCGTAT TAAGTGCAAT 300 

GATAGTTTTG ACATTTAGTT TCTAATTGGT CATTACTGCC GAGCAAATCT AGTAGAGTAA 360 

TCATGTAAAT CTTTAATGTG CCATTTGATT CACTAGCGGT GTTAATAACT ACGGAAATTG 420 

CATTTCCGAC TGAAATTTTT GAAAAATATC AACGTACGCT ACAAATAAAA TTTTAAACTG 480 

TTATAAATGT GTCTCAATTT* CATATGTTCA TCGACGATAT GAAGCGTATT ATGGTAAAAT 540 

GAAGAAATAA TAAACTTGTT AATAAATAAA ACATCACGAT TTGACTAAAG CACTTTATTA 600 

TTGTGTAGAT AATAGTTTTT TAACGAAATA AAAATGGCGA CTGGTTTTAA TAAATCAGCT 660 

AATGAATCAC TACACCTATA AGTATGAATA TAGTGATTAG AATGCTTTGT ATAGTTGGAT 720 

TTTGCAAAAT TGATGTTA 733 
20 (2) INFORMATION FOR SEQ ID NO: 394: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1270 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDN2SS; double 
•^^ (D) TOPOLOGY: linear 



IS 



30 



35 



40 



45 



SO 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 394: 



AAAAGTTGTA 


ATTAAAAGTG 


GGATTTTACT 


TAAGnnAGAA 


GGAAACTATT 


TATATGACTA 


60 


ATAAAAGAGn 


AGATGTCCGC 


AATATAGCAA 


TTATTGCTCA 


CGTTGACCAT 


GGTAAAACAA 


120 


CTTTAGTAGA 


TGAGTTGTTA AAACAATCTG 


GTATATTCAG 


AGAAAATGAA 


CATGTCGATG 


180 


AACGTGCAAT 


GGACTCTAAC 


GATATCGAAA 


GAGAGCGTGG 


AATTACGATT 


CTAGCCAAAA 


240 


ATACGGCTGT 


TGATTATAAA 


GGTACACGTA 


TTAATATTTT 


GGATACACCA 


GGACATGCAG 


300 


ACTTTGGTGG 


AGAAGTAGAA 


CGTATTATGA 


AAATGGTTGA 


TGGGGTTGTC 


TTAGTAGTAG 


360 


ATGCGTATGA 


AGGTACAATG 


CCTCAAACAC 


GTTTTGTACT 


TAAAAAAGCG 


CTAGAACAAA 


. 420 


ACCTGAAACC 


TGTTGTTGTT 


GTTAATAAAA 


TTGATAAACC 


ATCAGCACGT 


CCAGAGGGTG 


480 


TTGTAGATGA 


AGTTTTAGAT 


TTATTTATTG 


AATTAGAAGC 


AAACGnTGAA 


CAATTAGAAT 


540 


TCCCTGTTGT 


TTATGCTTCA 


GCAGTAAATG 


GTACAGCTAG 


CTTAGATCCT 


GAAAAGCAAG 


600 


ATGATAATTT 


ACAATCATTA 


TATGAAACAA 


TTATTGATTC 


ATGTACCAGC 


TCCAATTGAT 


660 


AACAGTGATG 


AGCCCATTAC 


AATTTCCAAG 


TAGCATTGTT- 


GGACTACAAT 


GATTATGTTG 


720 


GACGTATTGG 


TATTGGTCGT 


GTATTCAGAG 


GTAAAATGCG 


TGTCGGAGAT 


AATGTATCAC 


780 
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20 



GATTAAAACG TTTAGAAATT GAAGAAGCAC AAGCTGGAGA TTTAATTGCT GTTTCAGGTA 
TGGAAGACAT TAATGTTGGT GAAaCTGTAA CACCACATGA CCATCAAGAA GCATTGCCAG 
TTCTACGTAT TGATGAGCCT ACTCTTGAAA TGACATTTAA AGTTAACAAT TCTCCATTTG 

# 

CTGGCCGTGA AGGTGACTTT GTAACAGCAC GTCAAATTCA AGAACGTTTA AATCAACAAT 
TAGAAACAGA TGTATCTTTG AAAGTTTCTA ACACAGATTC TCCAGATACA TGGGTAGTTG 
CTGGTCGCGG TGAATTGCAT TTATCAATCC TTATTGAAAA TATGCGTCGT GAAGGTTATG 
AATTACAAGT TTCAAAACCA CAAGTAATTA TTAAAGAAAT AGATGGTGTA ATGTGTGAAC 
CATTTGAACG 

(2) INFORMATION FOR SEQ ID NO: 3dS: 
(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1365 base pairs 

.(3) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY; linear 



900 
960 
1020 
1080 
1140 
1200 
1260 
1270 



25 



' (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 3 95 



30 



35 



40 



45 



SO 



AAGACCAGGA 


GAACAmGTAA 


AACAATATAC 


AGTTGaAATC 


GCTCGTAAAT 


TAATGGAATT 


60 


TGATATAAAA 


TGCTCGTGAT 


TGCTTGTAAA 


TACGCAACTG 


CTGTnGCTTT 


AGAATATTTA 


120 


CAAAAGACCT 


TATCAATCCC 


CAGTGATTGG 


CGTAATTGAC 


CAGGTGCTAG 


AaCAGCAATA 


180 


ATGACTACTA 


GAAATCAAAA 


TGTATTAGTA 


CTAGGAACGG 


AAGGCACAAT 


TAAATCTGAA 


240 


GCATATCGTA 


CGCATATTAA ACGTATCAAT 


CCACATGTAG AGGTACATGg CGTTGCCTGT 


300 


CCAGGTTTTG 


TGCCACTTGT 


AGAACAAATG 


AGATATAGTG 


ATCCAACAAT 


TACAAGCATT 


360 


GTCATTCATC 


AAACACTGAA 


ACGTTGGCGT 


AATAGTGAGT 


CTGATACTGT 


CATTTTAGGA 


420 


TGTACCCACT 


ATCCATTGCT 


CTATAAACCT 


ATCTATGATT 


ATTTTGGTGG 


TAAAAAGACA 


430 


GTGATTTCGT 


CTGGATTAGA 


AACGGCTCGT 


GAAGTTAGTG 


CATTGCTAAC 


ATTTAGTAAT 


540 


GAACATGCAA 


GTTATACTGA ACATCCAGAT 


CATCGATTTT 


TTGCAACAGG 


TGATCCTACT 


600 


CACATTACTA 


ACATTATCAA AGAGTGGTTA 


AATTTATCTG 


TCAATGTC5GA 


ACGTATATCA 


660 


GTGAATGACT 


AGGAGGATTT 


TTAATGAAAG 


AGATTGTTAT 


TGCATCGAAT 


AATCAAGGGA 


720 


AAATAAATGA 


CTTTAAAGTA ATATTTCCAG 


ATTACCACGT 


AATAGGTATT 


TCAGAACTAA 


780 


TACCAGATTT 


TGATGTGGAA 


GAAACAGGAT 


CAACATTTGA AGAAAATGCT 


ATATTAAAAT 


840 


CAGAAGCTGC 


TGCAAAAGCA 


TTGAATAAAA 


CGGTCATAGC 


TGATGACAGT 


GGACTAGAAG 


900 
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10 



IS 



20 



GCGATGAAGC AAATATTGAA AAATTATTAA ATAAGCTTGG TAATACAACT GATCGTCGTG 

CGCAATTtGT TTGTGTCATA AGTATGAGTG GCCCTGATAT GGAAACAAAA GTATTTAAAG 

GTACTGTTTC AGGTGAAATT GCAGATGGAA AATATGGCGA AAATGGTTTC GGATATGATC 

CGATATTTTA TGTACCGAAA TTAGATAAAA CCATGGCTCA ACTTTCAAAA GAACAAAAAG 

GGCAAATTAG TCATAGACGA AATGCGATTA ATTTACTTCA AGCTTTTCTT GAAGGTGATA 

AAAATGTCTA AATGGATTAT TGTGAGTGAT AACCATACTG AATCAGGCGT TTTATATCAA 

ATTTATGAAA TGCACCCAGA TGCAGATGTA TATTTACATT TAGGA 

C2) INFOEiMATION FOR SEQ ID NO: 396: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1383 base pairs 
CB) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



1020 
1080 
1140 
1200 
1260 
1320 
1365 



25 



30 



35 



40 



45 



SO 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 396: 
AATTCCTGGT GCAATAATAA ATAGGATGAA AAAGATTCGG AAAATATGAT iyVCTCGTAAT 
CATAGCAACA TCGGCACCAG TA6CTAATGC • AACTAAAACT ATCTGATTAA CCCCTCCTGG 
TGCTGCACCA AGaAACAATT CATTAATAGO ATTATTATCA AAGAAATGTA TGATATAAAC 
CATGATTAGC GCACCAATTA TCAACATAAT ATTTTGAATT GTAATTGCGA TTGCTAGTCT 
ACCTTTTAAA TCTGACAATA AATGCGCAAT TTGAACTCCA ATTCTAATCA TATATATTAG 
TTGTGCCATG TTCAACAACC AATGATCTAG TGTAAATGTT AAACCTGTAG AAAAATTCCA 
AACAATTAAT ACAATGAGTG GTGCTAATAA TTGAAATGTT GGAAACTTTA TTTTAGACAT 
AATTAGATAA ACTATAAAGA TAGCTATCGC TAAAATAACT ATTTGCCCTA TCTTTAATAC 
TTGTGATAAA GGCAAGACTT TTGTTAACTT TCCATTCGCA TGCATGTTAC CATCATGAAA 
AAAATATGAA ATGAACGGTA CTAAAACAAC AACAAATATA ATTCGTGATG TTTGCGTTAA 
GCTAACAACT AACAAATTAG • CACGTTTGTC TTGTTCAGCC ATGACCAGCA TTTGTGTTAG 
TGCTCCTGGT ATAACACTTA AAATAGCTGT TTCTGTATTA ATACGTGCAA TTTTTTTAAA 
AACAAATGCC ATTACTATTG CAATTAATAA TATCGAAATA GATACAACAA TAATCGAAAG 
CCAATTGTTT TTAATATCCA TAACGACATT TTTCGTAAAC GTTGATCCGA TTTGCACACC 
TAATAGTACA ATACCTAATT CACTAAGTAA GAATGGCCAT TTAATATCAA GTTTGAAAAC 
TTTTACACAA ATGATTGATG CGATAATAGG ACCAAACATA AATGGAAGTA ATACGTGCGA 



60 
120 
180 
240 
300 
360 
420 
480 
S40 
600 
660 
720 
780 
840 
900 
960 
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5 



TATCATTGCC 


ATGTTTTCCA 


CTTCTTTCAA 


7AAAAAATAA AATGACTAAA 


TTGCTGCTTG 


1080 

a w w w 


AGCTTCACGT 


TTGTTAAGAT 


AACAATATCC 


GCTAGCAGTT 


tTGACTACAA 


AGCATATATG 


1140 


GaCTTTCACT 


ATCAAGTCGC 


CGCCCATGCC 


TTATATACAT 


TTAAAAnGAG 


CCTGAACAAA 


1200 


GTTCAGGCTC 


TCAATTTGTC 


CGTATATTTA 


TTTTACAATA 


CGACTTAAAG 


CCGTATCAAA 


1260 


TGCTTGAATC 


GTTTTTCAAT 


ATCTTCnTC 


GTGTGTGCCG 


TAGATAAGAA 


TGTACCTTCA 


1320 


AATTGAGATG GnGGnAAAAA 


CACACCTCTT 


TGnCATTCTC 


GGTACATTTC 


TGCAATAATT 


1380 


TCC 












1383 



(2) INFORMATION FOR SEQ ID NO: 397: 

IS 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 415 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 397: 

2s TCCACTAAnA TGATTACAAT TGCATTAOTT TGGTGGAGTG CATTTACAAT CTTAACGGGT 60 

ATGATTAAGA ACCACGGTTT AATTaTTTAG TGAGATTCTT ATTTGGTGTA GGTGAGGC6C 120 

CAATGTACCC TTCTAATGCT GTGTTTAATT CATTTTGGTT CTCTAAAAAT GAAAAAGGTA 180 

30 GAGCATCAAG TGCATTATTA GCAGGATCAT ATTTCGGACC TGTATTAGCA CCAATAGTTA 240 

CAATTGCTAT TGTTAACGCA TTTAACTGGC AAGCAGTATT TTACATTTTT GGTGCAGTAG 300 

GTATTTTAAT GGCkGTATtA TGGGCGATTA TTGCCAAAGA CTTACCTGaG CrACATAGwa 360 

. TGGTTAATGA AGCGGAGAAA CGTTTCATTA TGGAAAATCG TGATATCGTA GCTAC * 415 ' 



(2) INFORMATION FOR SEQ ID NO: 398: 
(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1141 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



45 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 398: 
TTTTAGaTaA aTyCAATTnT CyATaCTaAA TgATTnTCTT ATTaCGTCAA TTcGCCTTTT 60 

aTTTTATCGT AATCTTTCCa CTGCAAAGCT AAAGCTTCTC CTATTCTAAG ACCAGAATAA 120 

SO . , 

AATAACAGTC TAGTTAGCTG ACGAGAAGTA TCATTTGTGA TTTGTTCTAC TTTTTCATCA 180 
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AATGTGGGGT 


CGTATAAGA6 


CTTGTAATGC 


TTTTTGGCGT 


AATTGATAAC 


TGCTTTAAAA 


CCTGCCCACA 


CAGATCGTGC 


ATAGTCAACA 


GAAAGACCTG 


CATCGTTTAA 


CAAATAATTC 


CTQAAAGCAG 


TACATTGCGT 


AGTAGTGATT 


TTGCCAATAG 


GGATATTTCC 


GAACCTTTCT 


TTTATGTGAG 


TATTATATTC 


TGTAGTTCGC 


TTTTCTATTG 


AGCGTGCAGA 


AAGATTTTCA 


TTTTTTAAAC 


GATCAAAAAA 


TATATATTCA 


AAGGGTTGAT 


TGTCCGAGTA 


TCCATATTTA 


ACATTTTGTA 


TAAATTCGCT 


TTCAGCTAGT 


TTGGCATCTT 


TCTTACGTTC AAACCCACGC 


TTCATTTTTC 


GTTTGTTATT 


ACCGTATACA 


TCTTTATATC 


7AATGGAAAA ATACCATTTA 


CCTGTATTAT 


CATCCTTATA 


TACTGGCATT 


TTGCTTCTCC 


CTCCTCAAAA 


TTGGCA?VAAA 


ATAATAAGG6 


TAGGCGGGCT 


ACCCGAAATT 


TAGTACTAGG 


TACTAAATGT 


GATATAATAA 


AATAAAAAGT 


AGGTGATGTT 


ATGACATTTA 


AAAACAATCA 


TAATTTCAAT 


GAATTAGTTT 


TAACGAATGA 


AGACATTAGA 


A I'i'i'i'AAAAA 


ATGTCTTAGA 


AGATGCAGTC 


AGTGTTTATG 


ATGAATATTC 


GGTATGTAAT 


GAAGAATCCG 


ATTTTGCTTA 


CTGTTTATTA 


AGAGACTTAT 


ATACATTAGA 


CAGCTTAGCT 


ATTTCGTCAA 


ATAATGTTTG 


AATTATCGAA 


TTGXACTCTT 


CGAXriTAAr 


ACCATGCATA 


ATAGAGTTTC 


TGTGTTCAAT 


AGCAGCTTTG ACTGAATGTk 


TTAAATGTTC 


TTCTATTAAA 


TCGTTGTTTk 


CCAtTTCGtk 


TAaAAATGTt 


CyTATATTCC 



T 

(2) INFORMATION FOR SEQ ID NO: 399: 
(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 706 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEONESS : double 
. (D) TOPOLOGY: linear 

(xi> SEQUENCE DESCRIPTION: SEQ ID NO: 399: 
ACTGTGGTAG GTTTTTTATT TTGAAGTATT AATCATAACA GACTAATAAT CATGAGGTAA 
CTAATAACAC ATATTTAACT TGTATTCTTA AACTGGTATA ATAAATTTAT GTTGAAATGA 
ATATTGTATG ACAGGGTATT CACTTTTATT AAAAGGTAAA ATTAAATAAA GGTTTTATAG 
AACGTATTTA AATATATGAG GAGTAAACAA ATGGCTGATA GAACGAATAA AGAAATTAAA 
ACAGGACGCT TTATTGCAAC TGCATCAATC GTATTCTCAA TATTATTGAT . TATTCATTAC 
TTTGTTTCGT TGGATAATGC GACTGCCAAA GCATTACTTA ATTTAACGAA TCAAAACACT 
TCAGATAAAG CGATTGATTA CATTTTAAAC AGCTTTAGAT TCACTGGTAT TATGTATATT 
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10 



15 



ATGTTTGCAG TTTATGTATC AAATAGTTTG TTTACGTTGA TTAATTTATC AATCACAATT 
CAAGCAATAA AAGCTGCACA CGGTGCGTAC TTAACATTGC CAATTTTAAT TGTTATTATA 
GGTTCGGTTG CATTAGCGAT TTATATGCTT GTTGTTTCTA TCAAACGTAA AAGTACATTT 
AATCGCTAGA AAATTGATrr TAACAATAAA AATATGAAAA AAAAnn 
<2) INFORMATION FOR SEQ ID NO: 400: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1187 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDSDNESS: double 

(D) TOPOriOGY: linear 



540 
600 
660 
706 



20 



25 



30 



35 



40 



45 



SO 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 400: 
ACACAATCTG AAGATTCACG TTGTGGTGCT GGACATGATC GAAAAATTAG AGCTGAACAA 
ATGAnAGAAA TCAGTGATTT TGTTAAAAAG AAAAATATCC CTAAAGATGA AACGGTATAT 
ATAGGTGGCG ACCTTAATGT CAATAAAGGC ACTCCAGAGT TCAAAGATAT GCTTAArAAC 
TTGAATGTAA ATGATGTTCT ATATGCAGGT CATAATAGCA CATGGGACCC TCAATCAAAT 
TCAATTGCGA AATATAATTA CCCTAATGGT AAACCAGAAC ATTTAGACTA TATATTTACA 
GATAAAGATC ATAAACAACC AAAACAATTA GTCAATGAAG TTGTGACTGA AAAACCTAAG 
CCATGGGATG TATATGCGTT CCCATATTAy aCGTTTACAA TGATTTTTCA GATCATTACC 
CAATCAAAGC CTATAGTAAA TAGTGCTCAA CTAACTAATA ACTTGCTtCG TTCTAAAAGG 
ACGAAGCGAG TTATATTGTT AAAATTTGAA TTGACTTACA TTTTAATAAA ATCATCTTAA 
CAACTTTAAT TTTTCaTTAA TACAaGTCTT TACTCTACAC TCAAACnAGA TTCATACACT 
GCACGTCATA ATAAATCTAT CTATTCAAAT ATAAATAAAA GTTACCTACT ACATTCTATG 
TAGCAGGCAA CTTTTATTAC TTATTTCTTT TCATTATCAT TAAGTACTTT TACAAACTTC 
ACATTATGTG TCTTCCAATC AACTTCATAT AATGCTGATA ATTTTTCTTC TTTTTTATCT 
ACATGGTTTT CACCAGACCA ATAGCCCCAG AAACCATGGC GATTCCAATC TATTTTAAAC 
TCATCCATTG ATCTTTTATA ATGAACAACA AATTGTGATT TACCTTTGTC TTTTTTATCA 
TGTGACATAA CAGCTAAAAA TTCTGGATTA AACCCTTCAG ACACAGTTAC AGGCATTTTG 
TCTTTAGGTG TGAAATTATC TTTCGCCCAT AAATTTCCAT TTCGTGTTAA AGAAAAAATT 
TCACTTTTAG TTCTATTATC ACTATCATTA GTTAATTGTC TCGTATGGTC ATGTCCCATA 
TTATTTATCA AATGTGCTTC TACTTTCCAA CCTACACCTT TATGTGACGT AGATTGATCA 



60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
7B0 
840 
900 
960 
1020 
1080 
1140 
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10 



so 



(2) INFORMATION FOR SEQ ID NO: 401: 

<i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 847 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
(0) TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 401: 





CCAGAATTAT 


TTTTTCAAAA 


AGGACAATTT 


AACAATGTCG 


To 


CCGATGAAAG 


GGACAATGCC 


TAGAGGTAAA 


ACGGAaGCTG 




ACATTGCAAA 


CTTCTTC6AA 


AGATCGT6CA 


GAAAATGTCA 




AACGATATAG 


GGAGAATATC 


ACAGAGTGGC 


TCAATTAAGG 


20 


GAGGCATATA 


AAACTGTATT 


TCAAATGACT 


TCGATGGTAA 




ACAGACTTAA 


CTCAAATTTT 


AACATCGTTA 


TTTCCTTGTG 




AAACTGAATA 


CAATGAAATA 


TATTAAACAA 


TTAGAAAGTT 


25 


GGACAAriGG 


ACTATTACTT 


CCAACTGAAG 


ATGATAAAAT 




GCACTATTGA 


GTATAAATAT 


GGACAAGCGA 


TTTATGGAGT 


30 


ATTCTAAGCC 


AAAAGATGAA 


GTGAATGAAT 


TTTACGCAAA 


TATAATGCAA 


TTATTTGAAA 


CAATGAAAAT 


TGATAATGGA 




TCATACTAAT 


CGCATAAAAT 


GTTCTTCTGa 


GCGATTAAAC 


35 


ATGGCGAAAT 


GAATTAAACG 


ATGTAACAAC 


AAAGTATCAC 




AATCGTATTA 


AATGCTGAAA 


GCAAATTTGA 


AACGATAGTG 



TAGTTTT 

^0 (2) INFORMATION FOR SEQ ID NO: 402: 

. ..(i) SEQUENCE CHARACTERISTICS:- 

(A) LENGTH: 74 0 base pairs 

(B) TYPE; nucleic acid 

4S (C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



60 
120 

lao 

240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
840 
847 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 402: 
TGAAGATGAA GCAGAAGCAG AAGACAATCT GCTACGAGTA CAATCGAAGA AAGAAGAAGT 60 
GTATCGTCGA TTACTTGCTT CTAACTTAAC AAGCGTTCCT GAAAGtTTAT CATCATGAAA 120 
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GTTAAACAGT TAAAAGATAA AGTGTCTAAA ATTGTGATTC AAATGAATAC ATTTGAAGAT 
GAAGCAAATG ATGTTCTTGT TAATGCTGTT TATGCAGAGA AATTAATTCA ATATGGAAAT 
AGATATCGTA AGGACTATAG CAATGTTGAT AAGAGCTTAA ATGAAGCTGA ACGATTATTT 
AAAAATAATC GCTATAAGCg TGCGATTGAA ATTGCAGAGC AAGCTCTTGA AAGTGTTGAG 
CCAGGTGTTA CTAAACATAT TGAAGAAGAA GTTATTAAGC AATAGAAACT AGTATGTAGT 
TATACTTAAA TAATATGAGC ACTCTGTCAA ATTGGACTGA TGAGTTTAAT AATTGAAGTT 
AGCCAACGAT ACXSTTGTCTA GCTTCTTTTT TATATGGATA AATGaAAGGG ACAATAAATA 
TAAATAGCAA TTGTTTAAAG ATAAACGTAA TCAAATGTGT TGTTTTAATT AATATAAGTA 
GTGAAAAAAG CATAATCACA CAGCTCrTTA AATAGAGTGA AATAGTCTAA TTCTTATTTA 
ATAAGTAGAA ATAAGATTAT 
(2) INFORMATION FOR SEQ ID NO: 403: 
(1) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 630 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
.(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 403: 
ATGCCAATAA TTAAACCATG TAATAAATAT ACGTATAGCG TACGACTACC AATATAAGTA' 
TATAATTTTT TCTTTGTTGA CATTAAATTT AGAAACGCAG TCATTGCGAT TAATATAATT 
CCATATAATA TAAGTCGTTT AAAAGGACTG AATATACTCT GTCCTTCATT TTCAAGTGAA 
GTATATGGTG AACTTCCCAA TAACCAATCT GCATTGATAG GATGAATCAC GTAAACGATA 
AAAAACAAAA TAAAGGTAAT GATAGATACT GGTATTAGTT TTTTATTTTT AAAAATAGCC 
GTATGTTTTT TGGTGAAAAT GTAACCTAGA TAAAATATTG GGAAAAATAC GATTGTCCTT 
GAAATGCTTA AGTAGCTATC GATGTTATCT GAAAAACCTG CTCCAATAGA TATAATAATT 
GAAACTGATA GCACTTTATA TGGATTAAAT CTTCTAACTA TTACTAAAAT GACATGAAAG 
AAAAATAGCG TGATCAAAAA CCATAACGCA AATACTGGGT TAAAAGGATC AAGTTGTAAT 
TCGTCACTTT TACCTGTTAA GAAATAATAA ATTGAAAAGA ATGCAAAAAA TATCATATAA 
GGTACTATCA AACGTTTTGA AATTTTTTCT 

* 

(2) INFORMATION FOR SEQ ID NO: 404: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 6254 base pairs 
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(C) STRAI^ErDNESS : double 

(D) TOPOLOGY: linear 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 404: 
ATTTAAACGT TCAGTTTCTA AAAGTGGAAC AATCCAAGAA GTACGTAAAC GTGAATTTTA 
CGAAAAACCA AGCGTAAAAC GTAAAAAGAA ATCAGAAGCT GCACGTAAAC GTAAATTCAA 
ATAATTAATA CCTCTGTTGA CTCCCTCAAC ACGAATATTA ATTATATAAA ACAAACATCA 
CAAGTTAGTG TCTGACACTA ATATGTGATG TTTTTTTGTT GTCAATTTTT AATTAAAAAA 
AGTTATATAG TTTATAAATA ATCAAATTGA TATTCTATAG GTTCTTATAA CTATAAAGTA 
TATTCAATTT CATGTATAAT TAATGTGAGG GCGAGGTGAA ATTGTGAGTT ATAATAATTT 
TTTACAAATG ACAACTATCT TGGAATCAAC GGCTGGAGAT ACTTGGGTTG AACAAGTrAG 
CAATATAATT GTTCAACCTA TTTTTACGTT AATATTAACC TGTTTGACAT TCTTAGGATT 
TGTATATCAA CTTTACTCTA AAAAAATCAA TGCAGCTGGT ATTATCGCCA CATTATCATT 
ACTTATTTTA TTTTTGGGAT TTCTAATCCA AGGAAATGTC AATATGCATT CTATCTTAAT 
ATTCTCAATT GGCGTTATAT TAGTTGTAAT TGAATTATTT GTAGTTGGTG CAGTAATTGG. 
TATTATTGGC ATGATACTGA TAACTATAAG CATAACAACG CTCGGTGATA ATTTGCTATT 
TATGCTTGCG AATGTTATCG TTGCCTTGAT TTTAACGATT GTAGAATGGG TGATATTAGT 
GAAGATTTTC AACAGAAAGA TTCCGTTTTT GGATAAAGTT ATCTTAAAAG ATTCAACTAA 
TTCTGAGTCA GGTTACAATT CTCATGATAA CCGCTCGCAC CTCGTAGGAA AGACTGCTCA 
AACAGTTACA GATCTTCGAC CTGCAGGGAT TATTTTTTGT GAAAATGAAC GTATTGATGC 
TGTTTCAGAT GGCAACTTTA TTTTGCGCAA TAAAACGGTA AAAATCCTTG AAGTTGAAGG 
AACAAGAGTA GTTGTGAGGG AAGTAGATTA ATTAAAAGGA GCGATACCAT GTTTAGTTTA 
AGTTTTATCG TAATAGCAGT TATTATAGTA GTTGCATTAC TTATTTTATT CTCATTTGTA 
CCCATTGGTT TATGGATTTC AGCGTTAgcA GCTGGCGTTC ATGTTGGTAT AGGTACATTG 
GTTGGTATGC GTTTACGTCG TGTATCTCCA AGAAAAGTTA TAGCGCCATT AATTAAAGCG 
CACAAAGCAG GACTAGCATT AACAACAAAC CAATTAGAAT CGCATTATCT AGCAGGAGGA 
AATGTTGACA GAGTTGTTGA CGCTAATATT GCTGCACAAC GTgcTGACAT TGATCTTCCT 
TTCGAACGTG CTGCTGCAAT TGaCCTTGCA GGACGTGACG TATTAGAAGC GGTTCAAATG 
TCTGTTAATC CTAAAGTCAT TGAAACACCA TTTATCGCAG GTGTAGCAAT GaACGGTATT 
GAAGTGAAAG CCAAAGCTCG TATCACAGTT AGAGCTAATA TTGCTCGACT TGTTGGTGGT 



1297 



AGTAAGCATC ATACAGAAGT ACTTGAAAAC 
AAAGGTTTAG ATTCAGGTAC TGCATTTGAA 
^ ATTAGTAAAA ATATTGGTGC AGACTTACaA 
GCACAAGCAA AAGCTGAAGA ACGTAGAGCT 
GCGCGTGTAC AAGAAATGCA TGCTAAAGTA 

10 

ATGGCTGAAG CATTACGTTC AGGTAATATC 
ATGGAAGCTG ATACAGGCAT GAGAAATGCA 
GAGTCACCTG AACATTAAGT CGAGAGGTGA 
CATATCAGTG ATCATTTCTA TCATTACTAC 
AAATCAAAAG CCACCTCAAA AAACATCTAC 
20 . TGAAGAAATT GAGCGAACGT TTAAAGAAAT 
ATCATCGAAA CGAAAATATG ATGATACGTT 
AGAGCCTAAA TCGAAACCTG TTGTAGAACC 
ACCGATGACA GAGAAACCAA TCACAGTGCC 
ACCTTCTAGA CAAGATAATT CTGACGAAAT 
TGATATTAAA ACGATTCGTA CTGACATTGA 

30 

GGAAAAACGT GCTAGAGATA TTATTGAGGA 
GAAATTAAAG CAGCTGCTTA ATTCTCAAAA 
CCAATTTGAT AAAGATGAAG TAATCAATGG 

3S 

AAAACAATTA TAAAArTTTT TGAAAACAAG 
TACGTTAAGG AAAATTAAAA AACAAAGAGA 
40 ACAGCAAAAi^ ATTGATTAGT CTAAAATTGA 
- AATGATTATT TTAAATTAAA GAAAAATGAG 
AATTGCATGA TATAATTAAG TAGATATTAA 
GAAAAGGAGC GCGTGTATGC CTGGAATTAT 
TTTAATTGGA AATAATGATG AACATTTAAA 
CCATGCAAGA GGACAAGaAG TTGCCGTTAA 

SO 

GGAATCAGTA TTAATCAATT TGCTGAAGGT 
AGATGTTGAA GCAGCTATTA AAATGGCGCA 

55 
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CCAGATAATA TTTCTAAAAC AGTTTTAAGC 1680 

ATTTTATCAA TTGATATTGC TGACGTTGAT 1740 

ACTGAACAAG CATTAGCAGA CAAAAATATT 1800 

ATGGCTGTAG CAACTGAGCA AGAAATGAAA I860 

GTTGAAGCCG AATCTGAAGT ACCATTAGCT 1920 

AGTGTTAAAG ATTATTATAA TTTGAAAAAT 1980 

ATTAATAAAC GAACTGATCA AAGTGATGAT 2040 

TTAAATGAGT GTCGGTATTC TAATTTTTGT 2100 

TATGCGCGAA AATAGTCATA AAGATAGACA 2160 

CGATAATGAA CCAAAAAAAG GTGGCTTTTT 2220 

AAGTGAAGAA TTAAATGAAG AAGAAAAGAA 2280 

ACCACCTTTA TTCGATGAAC TTCCAAAGGA 2340 

TATGGCACCT AAAAAACAAC AAGAAACAAA 2400 
TAAAGCAGAA CCGGTGGAGC AGAAACATAG ' 2460 

TAGACGTCAA TTAGAAAAAT CACTTAGAGA 2520 

TAGAGAAAAA GAAAAGGAAA TTGCTAAAAT 2580 

TAAATACTTA TCTGAACGTA CAAAACGTTT 2640 

TGTCGAAAAA GATTTGACTA AATCAGCGTT 2700 

TATGATATGG TCAGAAATTT TAGCTAAACC 2760 

CACTATCGTA ATGGTAGTTG CTTGTTTTTT 2820 

ATTTTTCGAG AAATATTAGT TATTTAAATT 2880 

ATCTGCTTTT ATGACAAGGT GAAAAGTATA 2940 

TAAGTCAATG CAAAGATGTT . TAAATCAATC 3000 

AGCATCATAG AATGAATATA AATGAXATAT 3060 

ACAAATAGAC GATATGAACC AATCTCAAGC 3120 

AGCAATTGAA GAGAGTTTCG ATGTTGTCAT 3180 

AGGTACAAAA ATAGAAAACG TAGAAAAAGC 3240 

TATTGATTTA GGTAATAATA TTACAATTAA 3300 

TAATAACACA ATTCAACATC TGTTAGATTT 3360 
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GCAACGTATA TATGTTAATG CCATGAAAAA TAATGATTTA GTATTTGGTA 


TAGGTCCTGC 


3480 




TGGTACAGGT AAGACATTCT TAGCTGTAGT TTATGCAGCA AAGCAACTCC 


GTAAAGGTGC 


3540 


5 


TGTTAAACGT ATTGTATTAA CAAGACCTGC TGTTGAAGCA GGAGAGTCAC 


TTGGATTTTT 


3600 




ACCAGGAGAT TTGAAAGAAA AGGTAGATCC ATATTTAAGA CCTTTATATG ATGGTCTATA 


3660 


10 


TACTGTTCTT GGGCGTGAAC AAACAGAGCG ATTTATTGAA AGAgGCATTA TCGAAATAGC 


3720 


GCCACTTGCA TATATGCGCG GACGAACATT AGAAGATGCA TTTGTAATTC 


TTGATGAGGC 


3780 




GCAGAATACG ACACATGCGC AAATGAAAAT GTTTTTAACA AGACTAGGTT 


TTGGCTCAAA 


3840 


IS 


AATGGTAGTT ACTGGTGACC AAACTCAAAT CGATTTACCT AAAGGTGTTA AAAGTGGACT 


3900 




TAAGGAAGCG GTCAGTAGGT TACACAACGT TAAAGGTATA AGTATATTGA AATTAGATCA 


3960 




GAGCGATGTA GTCAgACATC CATTGGTAAG TAAGATCATT GAACATTATG AAGGAGAGAA 


4020 


20 


TTAAATGTTT ACGATAGATT TTAGCGATCA CACAGGCTTA GTTAAAGATG 


CTTGGTATAA 


4080 




ACAAATTGAA GATTTATTAG AATTTGCTAA AAAAGAAGAG CATATAGAAG 


ACGATGCTGA 


4140 




GCTTTCTGTT ACATTTGTAG ATAAACAAGA AATACAAGAA ATTAATCGAA 


CATATAGAGA 


4200 


25 


TAArGwTAAr GTTmCaGATG CAaTCyCaTT tGCTTTAGrA GrAGATGAGC 


CtnGaGATkGA 


4260- 


- 


TtTTAGTGGT CTTGATATAC CACXSTGTTTT AGGGGATATA ATTATCTGtA 


CGGATGTAGC 


4320 


30 


GCAAGrACAA GCAAACAATT ACGGACATTC TTTTGAACGA GAATTAGGAT 


TTTTAGCATT 


4380 


ACATGGATTT TTGCATCTAT TAGGTTATGA TCATATGACT GAAGCGGATG 


AAAAGGAAAT' 


4440 




GTTTGGTCGA CAAGATACAA TATTAAACGC ATATGGATTA ACACGAGACT 


AATTATGAAA 


4500 


3S 


AGGTTTAAAT ATGCACTTGA TGGGCTGAAA ATCTTAATTC AAAAAGACTA 


TAAATTTCTT 


4560 




TTACATGTGT TTGCAATGAT TGTTGCTATT GTCTTTGGTC TCGTACTAAA 


TATTAATCGG 


4620 




ATTGAGTGGA TATTTATACT CATTGCTATT GCATTAGTTC TCACTGTTGA 


AGCTTTAAAC 


4680 


40 


ACTGCTATTG AATATGTTGT CGATTTAGTG ACCGTTGAAT ATCATGATTT 


AGCTAAATAC 


4740 




GCTAAAGATA TTGCGGCTTT TAGTGTACTT ATAGTTTCAA TATTAGCATT TATTATAGGT 


4800. 




liAAiASaTAl' rrn'ACCACA TTTTATAGCG TTATTTTAGG GAGGCATATA 


TGAGTTATCA 


4360 


45 


ACCTCATTAT TTTCAAGAAG TTAGAAAAGC ACAACAAGAA TCATATTCGC 


CATACAGTCA 


4920 




ATTTAAAGTA GGGGCTTATT TAAAAmCGAA AGACgGTAGA ACTTTTTATG GTACCAATGT 


4980 


SO 


AGAAAATGCT TCTTATCCAT TATCGATATG TGCTGAACGA GCTAGTTTGG 


TATCGGCAAT 


5040 


TTCTCAAGGA TACAGACCAG GTGATmXSA ATCAACAACT GTAACCGTAG 


ATGCAGATAA 


5100 




ACCGTCATCA CCTTGTGGTG CATGTCGTCA AGTTTTGAAG GAATTATGTG 


ATGATGATAT 


5160 



SS 
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20 



25 



30 



35 



40 



ACCATTTGGA TTTTCAGGAA AGGATTTAGA ATAAATGACA GAACATAAAT CAGGATTTGT 
TTCAATTATA GGTAGACCAA ATGTAGGAAA GTCAACATTT GTTAATAGAG TGATCGGCCA 
TAAAATAGCA ATCAXGTCCG ATAAAGCTCA AACAACTAGA AATAAAATTC AAGGTGTTAT 
GACAAGAGAT GACGCGCAAA TTATATTCAT TGATACGCCA GGTATTCATA AACCTAAACA. 
CAAATTAGGT GACTATATGA TGAAAGTCGC TAAAAATACA TTATCTGAGA TAGATGCAAT 
CATGTTTATG GTTAATGCCA ATGAGGAmAT TGGACGAGGC GATGAATATA TTATAGAAAT 
GTTGAAAAAT GTTAAGACAC CAGTATTTTT AGTATTAAAT AAAATAGATT TAGTGCATCC 
AGATGAATTA ATGCCAAAGA TTGAAGAATA TCAAAGTTAT ATGGACTTTA CAGAGATTGT 
ACCTATTTCA GCATTAGAAG GGCTAAATGT CGATCATTTT ATTGATGTTT TAAAGACGTA 
TTTACCCGAA GnACCTAAAT ATTATCCAOA TGATCAAATT TCAGACCATC CTGAACAATT 
TGTAGTGGGT GAAATCATTC GTGAAAAAAT CCTTCATCTT ACAAGTGAAG AAATCCCTCA 
TGCGATTGGT GTTAATGTGG ACCGTATGGT TAAAGAAAGC GAAGATCGTG TTCATATCGA. 
AGCAACTATA TATGTTGAAA GAsGTTCGCA AAAAGGAATT GTCATTGGAA AAGGCGGTAA 
AAAGTTAAAA GAAGTAGGaA AAcGTGCGAG ACGTGAtATA GaAATGCtTC TAGGCTCTAA 
AGTTTACrTA GAATTATGGG TCAAAGTTCA AAGAGACTGG CGAAACAAAG TTAACTTTAT. 
TCGCCAAATT GGTTATGTTG AAGACCAAGA TTAATCTTAA AAGTGGTGAA GATAATTGTT 
AATGCGCCAA AAAGGGATTA TCATCAAAGC AGTTGATTAT GGTGAATCTG ATAAAATTAT. 
CACGATTTTA AATG 

(2) INFOKMATION FOR SEQ ID NO: 405: 

• (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3710 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



52B0 
5340 
540O 
5460 
5520 
5580 
5640 
5700 
5760 
5320 
5880 
5940 
6000 
6060 
6120 
6180 
6240 
6254 



45 



SO 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 405: 
GTTGTTCTAA ATGTTTCTTG nATGAAACGA GTCAATGTAA ACTGATATTG CTGTATTTGT 

TGCAGCAATT CATATTGGTC TGGTGTTGCA ATAACAGCAG CTTGAGTTGG AGTCGCAGCT 

• - 

CTGATGTCTG CAGCAAAATC ACTTAATGTA AAGTCTGTTT CATGACCAAC TGCTGATATA 
ATCGGTGTCT TACAATTATA TATTGCACGG ACGACAGCTT CTTCGTTGAA ATTCCATAAA 
TCTTCTATGG ATCCACCGCC TCGACCTACA ATAATGGTAT CTACACCTAA ACTATCTGCA 



60 
120 
180 
240 
300 
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25 



30 



35 



40 



45 



SO 



TGTATTTGTT CAGCTAATGG AAAACGACTA TTTATCGTTG AATGGATATC TCGAATTGCG 
GCACCTGTAC TCGCTGTTAA AACTGCAATT TTTTTAGGAA ACTTAGGTAT TGATTTCTTA 
TTCGCTTTAT CAAAACAACC TTCTTCAGTT AATTTTTTCT TTAATGCTTC TAATTTTTGA 
TATAAGTTCC CTATACCATC TAATTGCATT TTATTTACAT AAATTTGATA GTTTCCACGA 
CGTrCAAAAA CAGAAACACG TGCTTCTAAT AAGACTTCAT CTCCTTCTTT AGGTTCGAAG 
TTTAATTTAG AAGCACTACC TTTGAACATC ATGGCACTTA TAACGCTTTC TTTATCTTTC 
ACATTAAAGT ATAAATGaCC ACTTGaATGc TTTTTGAAAT TTGAAAGCTC ACCTTTAATC 
AATACAGATT GGAGATGTGG ATCTTGATCA AATTTATATT TAATATATTT CGTTAAAGCT 
GAAACACTTA AATAATCTGA CATATAACAT CACTCAATTT TATTTTTTTA TATTACTCAA 
TACACCATTT ATAAATTTAT AATGATCATC ATCACTGAAT TGTTTTGTTA ATTCAACTGC 
TTCATTCATT ACGACTTTAG CAGGTGTATC ACTGTGTAAT ATTTCATATG TTGCCATTCT 
TAAAATAATA CGATCCGTTT TTAATAAACG TGCAATAGTC CAATCTTTTA AATAAGGACT 
AATTGTCTCG TCTAATACAG GTTCGTGATC TTTAACGCGA GAAACTAGCC AATGAATAAA 
TTCGAAGTCT AAATCTGGAT TATCGTCTTT AATAAAGCTT ATCGCTTCAT TTATCGTTAA 
ATCACTGTCC TTCATTTCTA ATTGAAATAA AGTTTGAAAA GCTTGCACTC GGGATTCTTT 
ACGACTCATT TTTAACTCCT TCAAACGTTT GTATTTTTCT TTATTTAATT ACTGAATTAG 
GTATGACATT ACTTTTCAAT AACGATTTGT GTAATGTGAA TATTAATTTG CTTAGGTTCT 
ATCGCTGTCA TATTAGAAAT TGAATTAAAA ATTGACGTTT GAATTTTGTT TGCAGTTTTT 
GAAATATTAA CACCATGTTT TAATGCACAA TATACATCTA TATATATGCC ATCTTCTTTA 
CTCTCGATTT TTAAATCACG GCTTAAATTT TTACGACTAA CTTTTTCTAA ATTTGTTTCT 
TTTAATTCAG CAAAATGGCC AGTGATGCCT TCGACTTCCG AAGTAGCTAT ACTTGCAATA 
ACAGATAGCA CTTCTGGCGC TATTTCTACT TTACCTAATT TTGAATTTGA ATAATCAGTT 
ACTTTGACCA TGGATTGACC TCCTATTAAC CTTCATCATT CATAATGCTA TTTTGCTCTA 
AAAAGTTTGT ATTAAATTTA CCGCTTCTAA ATATATCGTT ATTCAATAAT TTAATATGGA 
ATGGAATAGT TGTATCAATA CCAAGAACCA CAAATTCACT TAGTGCACGA ATGCCAGCCA 
TAATCGCTTC ATCTCGTGTC GGTTCATGTA TGATTAATTT CGCTACCATC GAATCATAAT 
ATGGCGGTAT CGTATAATTA GTATAACATG CTGACTCTAT TCGAACACCA TATCCACCTG 
GTGCAAGATA TTGCTCmATT TTACCTGGTG ATGGCATAAA GTTCTTGTAA GGATTTTCAG 
CATTAATTCT AAATTCAATT GCGTGTCCTG TTAATTTAAT ATCTTCTTGT TTATACGGTA 



420 
480 
540 
600 
660 
720 
7B0 
840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1300 
1B60 
1920 
1980 
2040 
2100 
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10 



IS 



25 
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CAGTTACAGG ATGTTCTACT TGAATACGTG TATTCArTTC CATAAAATAA AATTTATTAT 2220 

CATTTAAATC ATATATAAAC TCAATTGTTC CCGCATTTTC ATAATTTACA GCTTTCGCTG 2280 

CACGAACTGC GGCATTTCCC ATTTCACGAC GTGTTTCATC ATCTAAAATT GGGGAAGGTG 2340 

CTTCTTCCAC TAATTTCTGC ATACGTCTTT GAATTGTACA ATCACGTTCT CCTAAATGAA 2400 

TTACATTACC ATAGCTGTCC CCAACAATTT GGATTTCAAT ATGGCGGAAG TTTTCGATGA 2460 

ATTTCTCCAT ATAAAGTCCA CCATTACCAA ATGCAGTTTG AGCTTCTTGT TCTGTCATTC 2520 

GGAAGCCAGT TTCAAGTTCT TTTTCATCAC GAGCAACACG GATACCTTTT CCGCCACCGC 2580 

CAGCAGTAGC TTTAATGATG ACCGGATAGC CAATTTTTTT GGCGATTTTC TTAGCTTCTG 2640 

AGACGTCTTT CATTAAACCG TCACTACCAG GAACAACTGG AACATTGGCT TTGATCATTT 2700 

CTGCCTTAGC AACATCTTTG ATACCCATTT TTTGGATAGA TTGATAACTT GGTCCAATGA 2760 

20 ACTTCAATTG GcATgctTCG CATAATTCTG CAAAATCAGC ATTTTCAGCT AAAAAGCCAT 2820 

• AACCCGGATG AACGCCATCA CAACCTGTAG AAGTTGCAAT AGATAAGATG TTCGGAATAT 2880 

TTAAATATGA ATCTTTAGAC AAAGTGGGAC CTACGCAATA TGCTTCATCA GCAATTTGAG 2940 

TATGTAGCGC ATCTTTATCC CCTTCAGAAT AGATTGCAAC AGTTTGGATG CCTAAATCAC 3000 

GACAAGCGCG AATAATCCTA ACTGCGATTT CACCGCGGTT TGCAATTAAA ACCTTTTTCA 3060 

TTATTTCACC TTAAATAACG GTTGGCCATA CTCTACCATT TGTCCGTCTT CTACTAAGAT 3120 

TTCAACAATT TCACCTGAAA TTTCTGCTTG AATTTCATTA AATAGTTTCA TTGCCTCTAA 3180 

AATACACACT GTTGTTTCAT TTGAAACAGT GTCCCCAACT TGCACATATG CTTCTTCGTC 3240 

35 TGGAGATGGC GATTTGTAAA ATGTACCTAC CATAGGTGCA TTAATTGTTT TGTGATTATC 3300 

- TGAAGTTGGC TTTGGAGCTT CAGITITATT GCTATCAGTT GATTGTGCTT. GAGGCATAGG 3360 

CATTGCCGCA GCTTCAACTG GCATTTGTGA GATTTGTGGC GTGATAATCT CAGTTTCTTT 3420 

TXCTTTCTTA AGCGTCACTT TGCCTTTAGT ATCTTCAATA TTGATTTCCG TTAAAGTTGA 3480 

TTTATCCAGA ATTTCAATTA ATTCTTTGAT TTCTTTAAAG TTCATTATTA CTGACTCCTT 3540 

CAGTTTGTTT TCATCTACCC GTCTATTTTA CTTGAGACAA CTCTTCAATT CAAGCATGTT 3600 

• CATATTGCTG GCGACATTAT AAGTCTATCC CAAAGTTATA ATAAAACCAC ATTTTAAATT 3660 

' AAAAACACTT GTGTATTTAT TACTTAACAT TGACTCATCT TAACTCTTGA 3710 
(2) INFORMATION FOR SEQ ID NO: 406: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1705 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

55 



30 



40 



45 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 406: 
GCTGATGTTC GTTGCCTTTn TCCACCAGAC AATTCAGAGG GATATTTATC ACTAATATCC 
AATATATTTA ATGCTTCTGC TACTTITTCA TAACGATTTA ACATATGTTC TTTATCTAAC 
TTCTGTACCG TTAGTGGTAA CATTATGTTT TCTTTAACAG TCAATGTATG CAGTAAATTA 
TACTCTTGAA AAATAAAACC AATATCATGC TTGCGTATAT CAGATwATTC CTTGTTTGAA 
AGCTTTTCTA ArmTTTCC TTTTAATGTA ATAGAACCTT GTGAAATATA ATCAATTGAA 
CTTAAAACAT TTAATAATGT CGTTTTCCCA GATCCAGAGG GACCCATAAT AGCAATAAAC 
TCGCCTTCTT CAATAGACAT ATTGATATCT CGCAACACTT CTTGTGCCAT TTTTTTAGTT 
CCATATATTT TTGTTAATTG TTTTACTTCT AAAATTGCCA CTTTAACACT CCTATAATTT 
ATCTTAACTT CATTTCCTTT AGGCTTTGGC ACTTGTATCT TCAATTTAAC ATATGACTAA 
CATCTATCTT ATTATAACGT TGAAGCTGCA TTGATGTATC AATTCTAAGT AACAAAACGC 
ATGTTTAAAA TGACAAATTT GTCACTTCCG ACATGCGTTC AACAATTTCA TTTTGTAATG 
GGAAAATCAA TCTGACAGTT GTCCCCTTAC CAACAGTCGA CGTGACTTGC AGGTGAATAC 
CTAATTGATC CTTTACACTA TTTACTAAAT ATAGACCCAT ACCTGAAGAC GTCGTTTCAT 
TTCTGTTAGC CGTTGACGTA AATCCTCGTT CAAATATTCG CGGCATATCT TTTTTACTAA 
TACCTCTGCC ATAGTCTTTA ATATATAACG AAACATGTTG ATCATTTAAT TCTGTCCCAA 
TTTCAATATT AAAATTCTCA CTATATTTCA ATGCGTTTGA CAAAATTTGT CTAATAATCA 
TACGACACCA TTTTATATCT GTATAAACAT AATCATCCAC TTTAAAGTCA ACATCAAAAC 
CAATACCTTT AACCTGACTA ATATGTCTTG TTAATTX5TAT TTCATCAATG ACCATGCGTT 
TAAGTGACAC GTAATCAAAA TACATATCTT TACGTTGAGA TTCTAATCTA GTAATATACA 
GCTGTGTATC TAGCATCGAG TTTATACGAG ACCATTCATA TAGTAATGCT TGTwTTCTTT 
CTTCATTTTT TTCTTGATCA ATTAATAATT TCATAGCTGT CACAGGtGTT TTTATGTCGT 
GCACAAATTC TGTAATGGTT TGTTCATGCA TGTTCAATTG CAACTGTTGC TCAACAACCT 
TTTCTTTGTG CGCTGAGATT TGACGATATA AATAATCAAC TGTATGACGT TGAAATGGCG 
TTTCCGCTAA ATCTTTATGT TTAATTTCTT CTATTTCTTT ATCTTTGTCA AAATGCTTAT 
ATAATTTTAC TTCTTTAAAA TATGTCAATA AAAGAAAAAT CATTGTTAAA CTTAAATTCA 
AAGAAACAAT ATAAAATAAA CTGTCTATTG GAAAATCATA ATCGATTAGA CTArTGCCTA 
ACATAAGGAA GTTTAAAAAC AATATCCAAA AtATCCAGTT CATGCGAGAT TTCAAAAAAT 
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GCACTATCCA TACTAATTTC AGATA 
(2) INFORMATION FOR SEQ ID NO: 407: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1722 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 407: 



TCAATATATC 


TTAAAATTCA ATGATTAAAT 


CnATTATCAC 


TAGACATnAA 


ATACATAAAT 


CCTATTCCCC 


ATTTTCATTT 


nTTAATTCAT 


AAATGAATCA ATAACCACCT 


AATAACAAAT 


CATATTATAC 


ACCTTTGTTC 


TCTATTTTTC 


TAAGGTTTAA AAAATATTTT 


TAGGTAAACC 


TAAAAATAGA 


TGTAATAAAA 


ACGCCTCCTC 


AGATATTTAT 


ATATCTATGA 


AGACGTTTAA 


ATACATTATA 


GATGGTCTGG 


TTCTGGGTGA 


ACGTATACTG 


AGGAAAtACC 


TTTTTTGTGC 


AAATGATGTT 


CGACATTGTC 


ACAAATTTGA 


TGCGCTTCTA 


CTAAGGAAAG 


GTTAGCATCT 


ACAACAATTG 


TGACATCAAT 


AAACACACTA 


CTTCCATGGT 


AACGCCCTTT 


AATACTTTTA 


ACTTCTTGTA 


CTTCATCAAC 


TTCTAAAATA 


TCATTGCGAT 


ACGCTTCTAA 


TTCAGTTTCA 


TTQAAACCAT 


CACTCAACAT 


AAAAATTGCT 


TCTTTAAAAA 


TACCAAAACC 


AGTATAAACG 


ATTAGTAAGC 


CTAGTAAtGT 


TGCTAAAATA 


ATATCGACAA 


TTGGGAAACC 


GATTTGCGTA 


AAAATTAATC 


CTATCGCTGT 


TCCAATGCTG 


ACTAAACTAT 


CCGATAAATT 




GCCGAATTTA 


AAGAACTACT 


TTTCGTTCTT 


TTCGCTAGTC 


TTTGATTGAC 


TGCAAATACA 


ATCAACATTA 


CAAGACCACT 


GATTAAGCTG 


ACGATAATTG 


TTATTGCGTT 


AGGTACAACG 


TCATCTTCTT 


TGAACAAACG 


AGGTGCATTT 


TGAATAACTA 


CTTGGATACC 


TACAAACATA 


ATGACAAATG 


ACACCAATAA 


TGAAGAAATA 


TTTTCAGACT 


TCAAATGGCC 


ATAAGGATGA 


TTTCGATCGG 


CAGGTTTAAT 


TGAAATTTTC 


AATCCAATAA 


TAACAGCTAA 


AGAAACGATA 


ATATCTGTCA 


TATTGTTTAA 


TGCATCGGCT 


CTTACAGCTG 


CAGAGTTAAA 


GACAAAACCC 


GTGACATACT 


TAACAATAGA 


TAAGATTATA 


TATACAATTA AACTCAAATA 


AGCACCGCGT 


TGCGCCAATT 


TAAGATTTTC 


ATTATGAGAC 


ATGCGTTGAA 


CCACCTTGAA 


TTAGTATAGT 


AACAATATTA 


TGAATGATTC 


ATTTTAATTT 


TACAACGTTT 


TTAATTTTTA 


TAAATTTTTA 


TAAAATTAAA 


CTAATTTATT 


CATTCGCAAC 


CCCTAAAAAT 


AATTTTTAGC 


CTTTCTGCGA 


ATTiTATGAG 


CTAGAAAGGC 


GCCCAACTCT 


eCCTGTTTGT 


TAACTTTCGC 


CTCGAAAGTT 
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10 



15 



CGAAwwTTAT GAGCTAGAAA GGCTTATGCA GTTGACGTTT TACGTCCAAC TGCGTTCCTC 
CGTCTTCTTC AAATTTATTT GTnAGAAAGG CACCCAACTC TCCCTGTTTG TTAACTTTCG 
CCTCGAAAGT TTCTATGTTA GAACCCTATG CATGAGTTGC GAAnTATCTA ATGTCGTGAA 
CTAATTATAT AGAAGAAAAA GTGCATCAAT GACAAATTAA ATGAGATTTC TACTCTACCA 
AACTCTCTTC GAAAGACAAT TTTCTCCTCT ATTTATTAGC AACTATTGCA TTTCTCCATA 
TAGTACTTCC TTACTTAAAA TACGCTGAAT GTCTGAATTA AA 
(2) INFORMATION FOR SEQ ID NO: 408: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 5521 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDSDNESS : double 

(D) TOPOLOGY: linear 



1440 
1500 
1560 
1620 
1680 
1722 



20 



25 



30 



35 



40 



45 



50 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 408: 
GCGAGACCCC CTGAGGGAGC AGTGCCCAGT CGAAGACCCG AGGCTGAGAC GGCACCCTAG 
GAAAGCGAcC ATTyCAATAC GAaTTgTGAt AAATAGAGAA CAGCAGTAAG ATATTTTCTA 
ATTGAAAATT ATCTTACTGC TGTTTTTTTA GGGATTTATG TCCCAGCCTG TTTTTTGTGA 
TTTTTAATAA TTTGAATATG GAAAATGTAT TATTCTCTCA TTTGTATAGA TTGTATTTAA 
TAAGTTAATG TAATCCTTGA GCTCACGATT AATAAAATTC TATAACCTTA ATTATTTTCT 
CGATACAAAG GGTTATTAAC TTTAATATAA GTATAATGAT GTGCCTCATC TTCAAGACGC 
ATTGTTGTAA CACACTTATA ATCTATAAAT GGCGCGAACA TGGTATCTTT AATTTCaTTT 
ATGCGATTCT CATTTACTTG ATTAGATTTG TGTGTCGAAA GTACAAGTTG ATCaAAAATG 
TTATCTAGTA CATCACGAAC GATATACCAC ATATGTCTTT CTAAGTTTGA ATCATTTGAT 
6CTTTAGAGA TTGTAAGAAT TAATTCGCCT AAATGOTTTT GAACGGTAGA ATAAAAGGCT 
TTGTTAAACA CAGACGTTTT TGAATCAGTA AGAATTCTTG ATTTTTCATG GAAATGAGAT 
GTACTGTATA CCATTTCATT TAGTTGTGCT TTATCAATTC TTAAACCTTC AAAGTCTCTA 
ATATACATCG TGTCCAATAG ACCATCTTTC CGAAATGTTG CAATAGCATT TTGCAAGTGA 
GCCTCTAATG CAATGCCATA TTTAGTAACT AGTGGGATTA CGAGACCAAG CAATGCTTTA 
CTATAAGTTT CAACCCACGA TTTCGCCGAT GATTCAAAAT CAGACAATGA TGCAGCTGAT 
TGATAACGTT TAATCAATGT CACGATAGGT GATTCATTGT TAAATGGGTA GGTTGCAACT 
AAGCTTGAAG GAATCAATGG TGTGACTTCT TGTGGAATCA TTTGGTATAT ATTTTTTCTA 



.60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
840 
900 
960 
1020 
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10 



15 



20 



25 



30 



35 



40 



45 



SO 



AAAAATGAAT ACCAGCAACT" TCATCAATAA TTGTTGATGC ATAGGACTTA AATATGACAT 

§ 

CTTTCTCCAA AATATCATTT AAAATACGTG TCATTAGTGG ACCATTGTGC GTCGTTTGTT 
CTGATAATGT ACGAATCTCA CCTGTAATAT GAACGTTTGT CGACAATTTG ATGTGTGGCXj 
ACATAGCTGG GTATTTAGGA ACTAATGTTC TGAAAGATAA ACCAGCATAA TAATCCaACG 
TATGTTTTGC TTCAATGATT AATTCTTTAT CTACTTCTGC TTGATAATCA GAATGXAATA 
CGTCATCTAA TTGCCATGGA TGAACAATCA TAATGTGATA ATCATTAAAG TTAAACTTTG 
GCGTAAATTC ATTTTCTAAT TGTTTAATTA AGTCCGGAAA TAGTTGATGA ACAGTTGTAT 
CATAATCTTT AGACAGTGAC ATAGTACGGC TTAATTTACT GTGAATCAGT ACTATTTTCA 
ACTTAATAGG TTGATTGAAT TCTGAAGAAT ATAGGAATGT TTGTAATGCA TTTAAACCTT 
TACGTAATTT AGCCCCAGGA TGTAGCGGAT GACCTTCAAT AACGGCTTGC TCTGAACGCA 
AGTAACTATC TTCGCTATTT TCGATAATAT TAAATAAAGG TGCAGAATCA TGTTGCATTG 
ACAGTGCTTG ATAGCTAATT GCAAATGTCA TATtAGTtGC ACTGTTTATT AAATCTTGCT 
GAAATTGATC ACTAGCAGCA TTTTTTAAAT CTGGTGCTTC AATTAAAATA CACTCAAGAA 
TTTCATTTGG ATGGTGTACT CGTGTAATCG TATTTGTAAT GTCATCTTTA ATGTAGAAAG 
GGCCTTCAAC ATCAATTCGA TCAAAGGC3GT GTTCTCCAGT GATAGGAGCA TATAATGTTT 
GCTTAGCTTG TGGQAACTGG ATTTCTAGTA TATGAGTCGT TGAGATATCT AACATAATCA 
AATCACGACT CAATATTTTC TTACTTTGAG TGCGCGCTTT AACTAAGTTT TCGCGATGCA 
TTGATGTGAC CAATCTCTGA GTGACTTTAT CTCTTCCTTG TAAAATCATC TCTTTAAAAA 
TATTAGCCCA ATCGCTATTA TGTTGTTGTA AAAATAAATA TGTTTCTTGT TCTTCTTTGT 
TAAATTTTAA TGTCTGTTCT TTAAAAATTA AGTTCAAGTT CATAATTCAC CTCTATGAAA 
TATTTTACAA AAGCAAGATA GATTTGTATA ATCCATATTA ATGATAATGA yTCTTATTAT 
CAACAGAATG CGGGTGTAAG TTTTATGACA AAATATTTTT TTAGCAGTTC TTTTCTACTA 
TTTCTAGGTA ATTGGATTGG ACAAATAGGG CTAAATTGGT TTGTACTTAC CACTTATCAT 
AACGCAGTTT ATCTGGGGAT TCTCAATTTT TGCAGACTTG TACCAATATT ATTACTAAGT 
GTGTGGGCAG GGGCAATTGC CGATAAATAT GATAAAGGGC GATTGCTGAG AATTACAATT 
TCATCATCAT TTTTAGTAAC TGCAATTTTA TGTGTGCTCA CGTATAGTTc ACTGCAATTC 
CAATTAGCGT CATTATTATA TATGCGACAT TAAGAGGGAT TTTAAGTGCG GTTGAAACAC 
CTTTAAGACA AGCAATCTTA CCAGATTTAT CAGATAAAAT ATCTACTACA CAAGCTGTmw 
CATTTCATTC ATTCATCATT AATATTTGTC GTTCAATAGG GCCTGCCATT GCTGGTGTCA 
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CAGTTTTATT ATGCTTACCA TTACATTTTA AAGTAACTAA AATACCTGAA GaTGCATCAA 
GaTACATGCC GTTAAAAGTT ATTATAGATT ACTTCAAATT ACATATGGAA GGTCGACAAA 
TATTTATAAC ATCATTATTG ATTATGGCGA CAGGTTTTTC ATATACGACA CTTTTACCAG 
TTTTGACAAA CAAAGTATTT CCGGGGAAAT CTGAAATATT TGGTATCGCT ATGACGATGT 
GTGCCATTGG TGGTATTATT GCAACGCTAG TTTTACCTAA AGTACTTAAA TATATTGGTA 
TGGTAAATAT GTATTATTTA AGTTCATTTT TATTTGGCAT TGCTTTGTTA GGTGTGGTAT 
TTCACAATAT TGTCATCATO TTCATTTGTA TTACATTGAT TGGGTTATTT AGTCAATGGG 
CACGTACGAC AAATCGCGTT TATTTTCAAA ATAATGTTAA AGATTATGAA CX5TGGTAAAG 
TACTGAGTAT TaTTATGATG GgATAGAGGT ATGaTTCCAT JcGGGAAGTCn ATTAATGAGT 
ATATGTGCAG ATGTGTTTGG CATTGTTAGA ACTTTTTCAA TAATGGGAAT AAGTACTATA 
TGCATTACAA TGGTATTCTA TTTTATAAAT AGAAAGTTGA AGTTAAAGTT GGAGGAAAGT 
AATCATGGTA TATCTTGAAT GGGCAAAGGC AGATAGAAAT ATTCAATATC GTGTAATTAA 
CGCCATTATT AAAGAACGTA TTTACCCCGA GCAAACATTT ATTTCGCAAA AAGGATCTTT 
AATTGAAATT CAGTATCATA TGCATGTGTT GACTATTGAA GTTGTTAGAA AAAGTGCATT 
AGAACGCTAT GAGTTTACAG GTGATATTAC TTATTTAAAT • AAAGGTGAAA CGTCATTAAT 
TATAACTTTA GAAGGTTTAT TAGATGTGTT GAATCATGAC TTTGATATCC CTATTTCAGA 
GCGACTACGC GAAGAGTTAA TACACAGTCG AGATAGTTTA GTTGAAACAT ATAAGCAAAT 
GTCTCACAGA CAAACGTTAA TAAGTCtnAAG TTTTAAATTT TCAAGGTTAC CACAAGATAT 
TAACTTTTTT XCaUcGGTtAC AACATGTAAA AGATAGTGAT AAGACAGATG ATTTAACTTA 
TTCTGAGAGT TTGGTACCAG AGGGGCATCC AACACACCCT TTAACCAAAA CGAAATTGCC 
CTTAACTATG GAAGAAGTAC GAGCATATGC ACCTGAGTTT GAAAAAGAAA TCCCTTTGCA 
AATTATGATG ATTGAAAAAG ACCATGTTGT GTGCACAGCT ATGGATGGTA ATGATCAATT 
TATTATTGAT GAAATAATTC CCGAATACTA CAATCAGATT CGTGTGTTTT TAAAGAGTTT 
AGGTTTGAAA AGTGAAGACT ATAGAGCGAT TTTAGTACAT CCTTGGCAAT ATGATCATAC 
GATAGGGAAA TATTTTGAAG CATGGnXTGC TAAAAAAATA TTAATTCCAA CGCCGTTTAC 
AATACTTCCA AAAGCaACTT aTCatTTaGG ACGATGTCTT TAATTGATAA ACcATACCAT 
GTTAAgTTGC CCgTCGATGC aCAAGCAACA AGTGCCGTTA GAACAGTCTC AACTGTGACT 
ACTGTAGATG GACCAAAGTT AAGTTATGCT TTACAAAACA TGTTGAATCa ATATCCaGGA 
TTTAAAGTTG CTATGGAACC GTTCGGTGAA TATGCAAATG TTGATAAAGA TAGGGCACGT 
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AGTGCAAGTC TAGTTAATAA AAATCCAATA GATCAAAAAG TTATCXTTGGA TAGTTACTTA 
GAGTGGTTAA ATCAAGGAAT TACTAAAGAA AGTATTACGA CATTTATTGA ACGATACGCT 
CAAGCATTAA TCCCGCCTTT AATTGCTTTT ATTCAAAATT ATGGAATTGC TTTAGAAGCA 
CACATGCAAA ATACAGTAGT GAACTTGGGG CCACATTTTG ACaTTCAATT TTTAGTGAGA 
GATTTAGGTG GTTCTAGAAT TGATTTAGAA ACATTACAAC ATCGTGTATC AGATATTAAA 
ATTACAAATG ATAGTTTAAT AGCTGATTCT ATAGATGCAG TGATTGCAAA ATTCCAACAT 
GCTGTTATTC AAAATCAAAT GGCAGAATTA ATCCATCATT TTAATCAGTA TGATTGTGTT 
GAAGAAACCG AATTATTTAA CATAGTACAG CAAGTAGTAG CGCATGCCAT TAACCCAACA 
CTACCACATG CAAATGAGTT AAAAGATATT TTGTTTGGAC CAACAATTAC TGTCAAAGCG 
TTG7TAAATA TGAGAATGGA AAATAAAGTA AAGCAATATT TAAATATTGA GTTAGATAAT 
CCGATAAAAA AAGAGGTGTA GTACTACATG GCACACGTTA ACATAAATAT ATCGAAGATT 
AAaTATAACG CCAAAGTACT TCAAACAGTT TTTCAAAGTA AAAATATGCA ATTCACACCA 
GTAATTAAGT GCATAGCTGG TGACCGTACA ATTGTAGAAA GCTTAAAAGC GTTAGGTATC 
' AATCATGTTG CAGAATCCAG ATTGGATAAC ATAATTAGTA TTGCAGATAC AGGATTTAAC 
A- " 

(2) INFORMATION FOR SEQ ID NO: 409: 

. (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1261 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : doixble 
<D) TOPOLOGY; linear 

(xi} SEQUENCE DESCRIPTION: SEQ ID NO: 409: 
AGGTCGTCTr GCaGmAGmGm TATTTGACGA TCTTGCTTTC CCAAAACACG ATGATGATTT 
TAACATACTG TCTGATTATA TTGAGACACA TGGTGATTTC aCATTGCCAA TGTCTGTATT 
TGATGATTTA TATGAAGAAT ATACGGAATG GCTAAAATTT TAATATAATT TTTAATAATA 
ATAGTTAGAA CCAGGGTGAT GCAATTCGTT ATCCTGGTTT TAATTTAAAA TAAACTAAGT 
TGTGACTAAA AATTAATCAA TTATAGTGAA ATATGGTGCG CTATCTTGCA TAAATTGATA 
TGATTAACTA CACAGAATTT AAAAGTACAT AATACATAAT AAGGAAGTGA TACAATGGAT 
GATAAGCAAC ACACATCTTC ATCCGATGAT GAACGCGCTG AAATTGCAAC AAGCAATCAA 
GACCAAGAAA CTAATTCATC GAAACGCGTT CACTTAAAAC GTTGGCAATT CATATCAATA 
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CAAAAAATAA 


GTGGTTTAAA CAAAACTGAT 


CAAGCAAACT 


TAAATAAA^T 


TGAAAATGTG 


TATAAAATCT 


TAAATA6TGA TTATTACAAA AAACAGGACT 


CTGACAAGTT 


AAG7AAAGCT 


GCAATTGATG 


GCATGGTCAA AGAATTAAAA GATCCTTATT 


CTGAATATTT 


AACAAAAGAA 


CAAACGAAAT 


CCTTTAATGA AGGTGTTTCA 


GGTGATTTTG 


TAGGTATTGG TGCAGAAATG 


CAAAAGAAAA 


ATGATCAAAT TATGGTTACT 


AGTCCTATGA 


AGGGATCTCC AGCAGAACGT 


GCTGGCATTC 


GTCCTAAAGA TGTCATTACT 


AAAGTAAATG 


GAAAATCAAT 


TAAAGGTAAA 


GCATTAGATG 


AAGTTGTCAA AGATGTTCGT 


GGTAAAGAAA 


ACACTGAAGT 


CACTTrAACT 


GTTCAACGAG 


GTAGTGAAGA AAAAGACGTT ' AAGATT AAAC 


GTGAAAAAAT 


TCATGTTAAA 


AGTGTTGAGT 


ATAAGAAAAA AGGTAAAGTT 


GGAGTTATTA 


CTATTAATAA ATTCCaGAAT 


GATACATCAG 


GTGAATTGAA AGATGCAGTT 


CTAAAAGCTC 


ACAAAGATGG 


TTTGAAAAAG 


ATTGTTTTAG 


ATTTAAGAAA TAATCCAGGT 


GGACTACTAG 


ATGAAGCTGT 


TAAAATC5G.CA 


AATATTTTTA 


TCGATAAAGG AAAAACTGTT 


GTTAAACTAG 


AnAAAGGTAA 


AGATACTGAA 



G 

(2) INFORMATION FOR SEQ ID NO: 410: 
(i) SEQUENCE CMARACTERISTICS : 

(A) LENGTH: 2488 base pairs 
<B) TYPE: nucleic acid 

<C) STRANDEDNESS : double 
(D) TOPOLOGY: linear 

ixi) SEQUENCE DESCRIPTION: SEQ ID NO: 410: 
AAATATATTG AAnAGAnAAT TACTAAGATT AAATCnTCTT AAAATATCCC TGAAATAACG 
TCCTAAAGAT TAAAGGAAAG AGGTTATAAG TTATGCCAAA ATTAATTTTA TGTCGTCATG 
GACAAAGCGA GTGGAATGCT AAAAACTTAT TTACTGGATG GGAAGATGTT AATTTATCTG 
AACAAGGTAT TAATGAAGCG ACTAGAGCAG GTGAAAAAGT AAGAGAAAAT AACATTGCCA 
TCGATGTAGC TTTTACATCG TTATTAACAC GTGCTTTAGA TACAACGCAT TATATTTTAA 
CTGAATCTAA ACAACAATGG ATTCCTGTAT ATAAAAGCTG GCGTTTAAAT GAACGCCACT 
ATGGTGGATT GCAAGGCTTA AATAAAGATG ATGCTAGAAA AGAATTTGGA GAAGAACAAG 
TACATATTTG GCGTCGTTCT TATGATGTGA AACCACCTGC TGAAACCGAA GAACAACGTG 
AAGCTTACTT AGCTGATCGT CGATATAATC ATTTAGATAA ACGTATGATG CCTTATTCTG 
AAAGTCTGAA AGATACTTTA GTTCGAGTGA TACCATTTTG GACAGATCAT ATTTCACAAT 
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TTAAATATCT TGAAGATGTG TCAGATGAAG ATATCATTAA TTATGAAATT AAAACAGGTG 
CACCGCTTGT TTATGAATTA ACGGATGATT TAGAAGTTAT AGATAAATAC TACTTATAAA 
AaAAGAGCTG CATGTACACA AGGAGTGAGT GTATATGcAG CTCTTAAAtA TGTGAAGTAA 
TGTAAGGAAA TAGTTAAGTA TAGAGTTTAT ATTAACGAGC TAGGGATACT CGAAAATATA 
GTTAGACATA CAATATAGTC AAATTAAAAC AATTATTTCG CTCTTTTATG TTGCTTAATA 
ATCTTTAAAG CACGCTTTCT TGTTTTAATG TTAGGGCTAT TTAAATTACG ACGAGCAGTC 
TGTAAATCTA ATTTCATCTC TATCCCTCCT TGTAAATATA TTATGACCGA TAACTACTCA 
TATGTAAATA GTAATGATTA CGTTTTAAAG AAATTGTAAT AAAGTCGTGC TAATTTTTTG 
GAAAATGGGT ATAATTACCG GATATCTAAA AATGTGTGTC GTTTTTTAGA TGGTGAGGGG 
GAAGCTTTAA ATGTCGAAGA AACAAAAA77 AACGATGATT ATTACTATGC TGATGGGTGG 
ATTTTTTGGA TTATTAAATG. AAACACTATT AGTGACGGCT TTACCAAGTA TTATGAAAGA 
TTTTGAAATT TCATATACAC AAGITCAATG GCTGACAACA GCTTTTTTAT TGACTAATGG 
GATTGTTATT CCTTTGTCCG CGCTTGTTAT ACAACGTTAT ACAACAAGAC AAGTGTTTTT 
AGTGGGTATT TCTATCTTTT TCTTAGGTAC ATTACTCGGC GGCTTGAGTC CGCACTTTGC 
AACATTATTA GTTGCTAGAA TTATTCAGGC GTTAGGCGCA GGTATTATGA TGCCATTGAT 
GATGACAACG ATTTTGGATG TTTTCCAACC ACATGAACX5C GGTAAATATA TGGGGATATT 
TGGTTTGGTA ATTGGTTTAG CACCAGCTAT TGGACCTACT CTTTCAGGTT ACCTTGTTGA 
ATATTTTAAC TGGAGATCGC TTTTCCATGT TGTCX3CTCCA ATTGCAGCTG TGACATTTTT 
AATTGGaTTT AAAAcGATAA AAAATGTTGG AACTACAATT AAAgTACCTA TTGATTTTAT 
TTCTGTCATT TTTTCTGTAC TAGGTTTCGG CGGGTTATTG tATGGAACGA GTTCaATTTc 
AGAAAAAGGT TTTGATAATC CTAcGtATTA GTATCTATGA TTGGAGGCGT TGTTTTAGTC 
GCATTATTTG TAwTACXjTCA ATATCGGCTA TCAACACCAT TATTaAATTT TGCrGTATTr 
AAAAATAAAC AATTTACAGT TGGTATCATT ATTATGGGTG TCaCAATGGT ATCGATGATT 
GGTTCGGAAA CGATTTTACC TATCTTTGTG CAAAATTTAT TGCATCGTTC AGCTTTAGAT 
TCTGGATTAA CTTTATTACC AGGAGCAATT GTTATGGCAT TTATGTCGAT GACTTCGGGT 
GCTTTATATG AAAAGTTTGG TCCTAGAAAT CTTGCTTTAG TAGGTATGGC GATTGTTGTT 
ATTACTACGG CTTATTTTGT TGTAATGGAT GAACAAACAT CAACAATCAT GTTGGCAACA 
GTTTATGCGA TTCGAATGGT TGGTATCGCG TTAGGATTAA TTCCAGTAAT GACCCATACG 
ATGAATCAAT TAAAGCCAGA AATGAATGCA CATGGTTCAT CTATGACAAA CACAGTACAA 
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AACTTTTCTC CAACTATGTC AGACTATA 2488 
(2) INFORMATION FOR SEQ ID NO: 411: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1105 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 411: 

TTTTACAATT TCAGATATCT CTAAAACACA TACCGATCCA ATGGCCAAAA TTATTCGTCA 60 

AAAATTGAAA AAACTAGGAA TTCGTAAAGG GATTCCAGTT GTATTTTCAG ATGAAAGTCC 120 

AATTGTCATA AGAGAAGATG TAAAAGATAT AGTTGGAGAT AAAAATGCTA TCAATCGAAA 180 

20 AGGACAAATG CCACCTTCTT CAAATGCCTT TGTGCCAAGT GTTGTTGGAT TAATTTGTQC 240 

AAGTTATGTG GTGAATGACG TATTAAAAGA TATTCCAGTT CGTCGCATTA AAGACAAAGG 300 

GCAATAATTC ATTTTGAAAG GGATAATTTT CAACGTAAGG CAAGTGTAAC CACACCATAA 360 

2S AACTAAAACT GACTAGTTCG CAAGCATAGT AGAATATGCC TCGTGTACTA GTCAGTTTTG 420 

ATTTGATTAT AGCTAAAATA TCAAAGGTAA TCGATTTAAT CTTATTTTTA CGGCCTTTGT 480 

TTAAGTAAGT TGTTATATAT TTCTTTGAGT TGTTGTTCAC TTTTAGATGT CGTTTTTGGT 540 

TCGTAATAAA TTTTGTTTTT TAGTTTATCA GGTAAATATT GCTGTGAAAC ATAGCCATTA 600 

ACATATTGGT GTGGATATTT GTAACCAATA GATCGGCCTA GATCTTTAGC ACCTTGATAA 660 

TGTCCATCTT TTAAATGGTT TGGAATTTGG CCCACATGAC CGTTTCTAAT ATCGGACAAT 720 

- GCACTATCAA TGGCACTCAT TGCTGAATTT GACTTAGGTG ATAAGCATAG TTCGATTACT 780 

GCTTGGCITA GTGGAATTCT AGCTTCTGGT AAACCTAGAC GTTCTGCTGA TTCAATAGCA 840 

GCAAGTGTTC TCTGACCAGC ATTAGGTGAG GCTAAGCCTA TATCCTCATA GCTAATTACA 900 

AGTAATCGTC GAACTATTGT AGGTAAATCT CCAGCTTCAA TTAATCGTGC TAAATAATGT 960 

AAAGCGGCAT TGACGTCGCT ACCACGGATA GATTTTTGGA AAGCGCTCAT AACATCGTAA 1020 

45 TGCATGTCAC CATCCTTGTC ACTTACAAAT GCACCTTTTT GTAAACAGTC TTTAGCATCT 1080 
TGCAATGTAA CATGTCGATA ACCGT . 1105 
(2) INFORMATION FOR SEQ ID NO: 412: 



(i) SEQUENCE CHARACTERISTICS: 

<A) LENGTH: 579 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 



$S 



1311 



EP 0 786 519 A2 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 412: 
TAACGTCGAA CTTGAGCTGT TACGTTATGA CTCATAATTA TTTTAGCATA GTCATTTAAA 
TAAACTTCTG TTCTGTCTGT TGGATAAGCA AATTCAAGCA ATTGACTGTA ACTATCATTA 
ATGACTTCTT GATCAACATG ACTATCAAAA TATACAGCAT AATAATAAGT ACCATCAACC 
ATATATAACA AATCTTCAAA CTCTGTAGTT ATTGGATTGC TATGATATGC ATAATTAATA 
ACATCTTCTA AATCGTTAAA TTTCACAATG ATTGTTCTTG TATTTTTACG TGCTGAAGAC 
TTTTGACGTT TAGAACCTTG AGCTTCTTTT TCTTTTGTTC GTTGCTCGAA TAATTCTTCT 
AATTGATCTT CACCTTCTAA TGTTTGAGCT AACAATTCTT GAACTTGTTC ATCAAATkGA 
TCAGTTGCAT CATCATCAGA CATATTCATC ATATCTTCAT TTTTAGATTT AGAAATTGTG 
ACTTCGACAC CTTTTTCAAA GGCATGTACT TGAATCCATA ATGGACCTnC TACAACAAAA 
TCTTCTACTT CGTTAATTTC ATCCATCATT GAnCAAAAG 
(2) INFORMATION FOR SEQ. ID NO: 413: 
- (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1342 base pairs, 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 413: 
GTGGTGAAAC TTCTTGCTTT GTAATTTTAT AAAGTGGATC AATATCACTC TGACTTACAT 
CAGGTTGAAC TGTCATCTTT TTAGTTACTT TGTTTTCAAG CGTAATATTT GCTAATTcTA 
GGtTTTACAG AATAATGAAT GTCATCAGCT AmCCCTTTmin CtTGATACTy CTCTTGATAT 
TTTCCAGCTT TAGCATTTGA TAAATCAATC ACTACTCTTA AATCTTCTGG ATTTTCAATT 
TTTATTATCT TTGATTGTGG TCCTGAAATA GTCACATTAA CTGTTTCAGG CGCTTTTGTT 
AAATGCAAAT . CTTTAGTGTT ATAAAGAATT TCAACGGGTA CATCTTGAAT CGTTTTACTA 
GACTTTTGAC CAAGATTACC AGTGTTAAAG ATATTTCCAA AAACATTGTT AACAGATAAA 
AAGAAAAACA ATGCCAAAAG AAAGGCAATA AATCTCAAGC CCCATTTACT TTCTAGCATA 
TTATTTCACA CCTTTCTTTT GAAAGCGTGT GCCAAACCAA TGTTCAGCAA GCAACTCTTC 
AAAAATTTCG TTTGAAATGT CTCGTCGTAA TTTTCCATCA AATGTTACCG AAATATCACC 
AGTTTCTTCA GATACAATAA CGGTAAATGC ATCAGATACT TCTGAAATAC CAACCGCAGC 
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TGCTGCTGCT GCAATCTTCG TGCCTTGAAT AATCATTGCA CCATCATGTA AAGGTGTGTT 
AGGTATAAAG ACATTAATTA AAAGTTCTTG CGAAATATTT GAATCCATTG CAATACCTGT 
TTCAATATAA TCTTGAAGAC CrGTTTCrTT TTCAAAGACA ATTAATGCAC CTATACGTCT 
TTTAGCCATA TATTGCACAG CCTTTGAAAC CGATTGAATC AATTTCTCTT CATCTTTACT 
ATACGTATTA GAAGTATAGC GTTTTAAAAA GCTACCTCTA CCAAGTTGTT CTAACGCACG 
TCTAATTTCT GGTTGGAATA TTACTATTAA AGCTAATACC CCCCATTGAA TAACGATATC 
GAATAATTTA GATGTTGCAG TCAAGTTCAA TATCATACTT ATCTGCTGAC CAATAACAAT 
TACTAATATC CCTTTAAGTA ATTGTATCGC TTTAGTTCCC TTAAAGACCG TGATGAGAAG 
ATAAAGTACA TACCAAACTA TCAGTAAATC AAGGATACTC GTTACAATTT TTAACXjTACT 

gaggttttga aaaaagttgg aaaaatccat aacatctcct ccgggtaata tttttccata 
atacccatta taccaatcai: tt . 
(2) information for seq id no: 414: 
(i) sequence characteristics: 

(A) LENGTH: 1073 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 414: 
CTCTATAAAG ATGGAGGTGT TTTGCATGGT AAAACGTACT TATCAACCAA ATAAACGTAA 
ACATAGTAAA GTTCATCGTT TCAGAAAACG CATQAGCACA AAAAATGGCC GTAAAGTTTT 
AGCGCGCCGT CGTCGTAAAG GCCGTAAAGT TTTATCTGCA TAAGATCACT GACTCATCAG 
TGAtCTkTTT TTTCGTTTAA ATTAAGAATA AATAGAAATT TATGTTATAA GCTCAATAGA 
AGTTTAAATA TAGCTTCAnA TAAAAACGAT AnATAAGCGA GTGATGTTAT TGGAAAAAGC 
TTACCGAATT AAAAAGAATG CAGATTTTCA GAGAATATAT AAAAAAGGTC ATTCTGTAGC 
CAACAGACAA TTTGTTGTAT ACACTTGTAA TAATAAAGAA ATAGACCATT TTCGCTTAGG 
TAITAGTGTT TCTAAAAAAC TAGGTAATGC AGTGTTAAGA AACAAGATTA AnAGAGCAAT 
ACGTGAAAAT TTCAAAGTAC ATAAGTCGCA TATATTGGCC AAAGATATTA TTGTAATAGC 
AAGACAGCCA GCTAAAGATA TGACGACTTT ACAAATACAG AATAGTCTTG AGCACGTACT 
TAAAATTGCC AAAGTTTTTA ATAAAnAGAT TAAGTAAGGn TAGGGTAGGG GAAGGAAAAC 
ATTAACCACT CAACACATCC CGAAGTCTTA CCTCAGACAA ACGTAAGACT GACCTTAGGG 
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TTTAGATACA ATTACGAGTA TTTCAACACC AATGGGTGAA GGGGCAATTG 



GAATTGTTCG 



840 



ATTGTCTGGA CCGCAAGCCG TTGAAATTGC TGACAAATTA TATAAAGGAA 



AACATCTTTT 



900 



AAATGATGTT CCATCACATA CGATTAATTA CGGTCATATT ATTGATCCAG 



tCTAAAGAAG 
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TGGTTGAAGA AGTTAXGGTG TCTGTGTtAA GAGCGCCAAr AACATTTACA CGCGArGATA • 1020 



(2) INFORMATION FOR SEQ ID NO: 415: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3176 base pairs. 

(B) TYPE; nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 415: 

CTTTACCAAT GCCAAATCCG AAGTAAAGTA TAGCAATAAA GATTACTAAT ACAATTCTGT SO 

AAATGGCAAA TGGAATTAGT TTGATTTTGT TAATTAGATG CAAGAATGTT TTGATTGCAA 120 

TTAGTCCAAC AGTAAATGCA GCTAAAAAGC CTAAAATATA AAAAGGTATA TCAGCAATCT 180 

GAATATCTTG ATAATGTTTT , AATAAAGATA AACCACTAGC TGCTAACATA ATTGGAACAG 240 

CCATAATTW^ TGTAAAGTCC GATGCTGCTT TATGATTTAA TTTCATTAAT ACCCCAGTTG 300 
AAATTGTTGA GCCTGAACGG CTGAAACCAG 6CCACATAGC TACTGCTTGA gAAATACCAA . 3.60 

TTACAAATGC TTGGAAATAA CTGATTTGAT CTACTGTTTG TGGGTTTTTA ACTTTAGCTG 420 

AGTATTTATC AGCAATAATC ATATAGATAG CACCTACGAA TAAGCCAATC ATAACAGTTG 4 80 

GCACACTAAA TAAATGTTCT TCGATGAAAT CATCAAATAG TAAGCCTAAA ATACCTGCTG 540 

GCACCATACC CACTAATACA TGTAATAAAT TTAAACGTCT TGGCTTTGAA CGTCTTTGTT 600 

GATCGTTATC TCCTTCAACA TGTTTGTGTT TACCAATATG TAAAATCTCT AAGAAGCGTT 660 

CGCGGAACAC CCATGCTGCT GCAAAGACGG ATCCTAATTG GATGACGATT TTAAATGTAA 720 

ATGCTGACTG AGAACCTAAA AATTCAGATG ATTTTAACCA CATATCATCA ACTAGGATCA 780 

TATGTCCAGT AGAGGAAACA GGTGCAAATT CTGTTAATCC TTCGACGACC CCTAAGATAA 840 

TACCTTTTaT TAATTCAATG ATAAACATAA TGTACCCACT TTCATTACTC AATTTAATTT 900 

ATTTAAATAT CAAAATTACC ATATCATGAT AGCATATTCA TTTAAAGACA TGCTAGTTAT 960 

AGTTATAATA CTAGACTAAA GATGTATATA TTCATTTTCT TTTACATGTA AAACTACAAT 1020 

ATTTTATTGA GCTATTTAAT TTGATTTTAA GGAAAACCTT TTATAATAGG TTTAGGTGAT 1080 



TTATAQAgAT TAATTGTCAT GGTGGtATTk TAACGATTAA TAGAGTGCTG 



GGA 
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TTCTTGGTCA 


GTACTGGTCT 


CGGCATAATC GTTATAACGC 


AAAATATTTT 


AATAGCAGAT 


1200 




TrriTAGCTA 


AAATTATAAG 


ACATCAATTT CAAGGTTTAT 


GGATTGTATT 


ATTTATTTTA 


1260 


5 


TTAGGTGTTT 


TACTTTTAAG 


AGCAACTGTG CAArTTCTAA 


ATCAATGGTT 


AGGTGATACA 


1320. 




TTAGCATTTA 


AAGTTAAGCA 


TATGCTTAGA CAGCX3GGTTA 


7TTATAAAAA 


TAATGGTCAT 


1380 


10 


CCAATCGGTG 


AACAAATGAC 


TATACTCACA GAAAACATTG 


ATGGTCTAGC 


ACCTTTTTAT 


1440 


AAGAGTTATT 


TGCCTCAAGT 


GTTCAAATCA ATGATGGTTC 


CGCTCATCAT 


AATCATTGCA 


1500* 




ATGTTTTTCA 


TCCATTTCAA 


TACCGCATTA ATTATGTTAA 


TAACTGCACC 


ATTTATTCCT 


1560 


IS 


TTGTTTTATA 


TTATTTTCGG 


TTTGAAAACG CGAGATGAGT 


CAAAAGATCA 


AATGACTTAT' 


1620 




TTGAATCAAT 


TTAGTCAACG 


GTTTTTAAAT ATTGCTAAAG 


GTTTAGTGAC 


GTTAAAGCTA 


1680 




TTTAATCGTA 


CAGAGCAAAC 


AGAGAAGCaT ATTTaCGACG 


ATAGTACTCa 


GTTTAGAACT 


1740 


20 


TTAACAATGC 


GCATTTTaCG 


CAGTGCTTTT TTATCGGGAT 


TAATGCTCGA 


ATTTATAAGT 


1800 




ATGTTAGGTA 


TTGGATTGGT 


TGCATTGGAA GCAACGCTAA 


GCTTAGTAGT 


ATTTCATAAT 


1660 




ATTGArriTA 


AAACTGCGGC 


AATTGCGATT ATTTTAGCGC 


CTQAATTTTA 


TAATGCAATT 


1920 


25 


AAGGACTTAG GGCAAGCGTT CCATACTQGA AAACAAAGTG AAGGTGCCAG 


TGACGTTGTG 


. 1980 




TTTGAGTTTT 


TAGAACAACC 


GAACTATAAT AATGAATTTC 


TATTAAAGTA 


TGAGGAAAAC 


2040 




CAAAAGCCAT 


TTATTCAGTT 


AACAGACATA TCATTTCGAT 


ATGATGATTC 


TGATAGATTG 


2100 


30 


GTATTAAATG 


ATTTAAATTT 


GGAAATATTT AAAGGTGATC 


AAATTGCACT 


TGTAGGTCCA . 


2160 




AGCGGGGCAG 


GTAAATCCAC 


TTTGACACAT CTTATTGCAG 


GTGTTTATCA 


GCCAACAATA 


2220 


35 


GGTACTATAA 


GTACAAACCA 


GCGTGATTTA AATATAGGAA 


TACTTAGTCA 


ACAGCCATAT 


2280 


ATTTTCAGTG 


CTTCTATAAA 


AGAGAATATT ACGATGTTTA 


AAGATATAGA 


AAATAATACT 


2340 




ATTGAAGAAG 


TGCTAGACGA AGTAGGTTTA TTAGACAAAG 


TGCAATCTTT 


CACAAAAGGC: 


2400 


40 


ATTAACACAA TAATAGGTGA AGGAGGCGAA ATGTTATCTG GTGGACAGAT 


GAGACGCATA 


2460 


GAACTTTGCC 


GTCTTTTAGT 


TATGAAGCCA GATCTCGTTA 


TA'rnXSATGA 


GCCTGCAACT 


2520 


■ 


' ■ *■ " . . » " 
GGTTTAGATA TTCAAACAGA ACACATGATT CAGAACGTTC 


TGTTTCAACA 


TTTTAAAGAT 


2580 


4S 


ACAACGATGA 


TTGTCATTGC 


ACATAGAGAT AATACAATTC 


GCCATTTACA 




^o40 




TATATAG AAA 


ATGGAAGACT 


GATTGCTGAT GATCGCAATA 


TTTCAGTAAA 


TATAACAGAA 


2700 




AATGGTGATG 


ACTTATGAAA 


ACACGACTAA AATTTCAAGT 


AGATAAGGAT 


TTATTGTTAG 


2760 


SO 


CTATAGTTGT 


TGGTGTTTGT 


GGAAGTTTAG TTGCGCTCGC 


CATGTTTTTC 


TTAAGTGGTT 


2820 




ATATGGTGAC 


ACAAAGTGCA 


CTTGGTGCGC CACTATACGC 


TCTGATGATT 


TTAGTCGTTA 


2880 
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ATAAAGCTAC ATTTACAATG CTACGTGATA TTCGGGTACA GTTTTTCGGT AAATTAGTAA 
ATGTCATTCC TAATGTTTAC CGTAAACTGA GTTCTAGTGA TTTAATTTCA CGTATGATTA 
GTCGTGTTGA GGCATTACAA AATATAJcATT TACGTGTTTA TTATCCACCA GTCGTCATCG 
GTTTGACAGC GCTAGTTACA GTCATAGTTT TGGCGTTCAT TTCAATCGGC CATGCG 
(2) INFORMATION FOR SEQ ID NO: 416: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2109 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(Xi) SEQUENCE DESCRIPTION; SEQ ID NO: 416: 
TCTTTATTTC AATTTCCAAT TGAATTTTTT TATTATTTAC GCATAGCTCT TAAAATTAAC 
GTTACGATTG CAATTAAGAT AATTGAACCA ATTAATGCT6 GCAAGATGTA AATACtTCCT 
AATTCAGGAC CCCATTGTCC GAATAGTTTG. CCACCTACCC ATGATCCAAT AATACCTGCG 
ATAATATTGC CTAAAATACC ACCTGGGATA TCTTTACCCA TAATAGCACC AGCAGCCCAT 
CCAATTAAGC CACCGACAAT TAACATTCCA ATAAATCCAA ACATAATTTT CAGTCTCCTT 
TTTCTATTTA TTTTGCGTTA TTCTAAGTAG TACCCCTTAT TTACAATTCT AAAACAAATT 
CAAATTATTT TTATCCAAAT ATTTTTAAAA GTAGTAATTG AATATCAATT TTATTCAATG 
TAGCTATCGT TATTTAAAGT CTCTGTACCG ATAATATCAT ATACATTTAC ATTATTTTTT 
CTGCCGAATT CATAGCTTGA TTATTTTATG TTATAGGACT AgAATATACA CATATTATTA 
GAGCATCTTT GAATTTTAAA TCAAGAAGCG AGGTTAATGA ACAATGAATA TGCATATTTT 
ATATaACTTA CGAACTAAAC ATAATTTAGA AATTGACGAA TTAGCACAGC AATTAAATGA 
GAAATATGGT ACTAAATATG AAGCACATCA AATTTGGGAA TGGGAGAATC ATCACCATGA 
ACCTAAATTT AAAGATGCCA TGCATTTAGC TGACTtCTTT GATGCACCAT ATGAAATGTT 
TTTAGAAAGT AAGGTTAAAG AATATCAGAA ACATTTAGAA GAAGTCGATA TTCGCATGGA 
TAAATAGATG CAAATAAACC CTCACAACAC GTTTGGCATA TATCCTTTCA AATCTATACT 
GGATATATTA CATTACGTTG TGAGGGTATT TTATTAATTA ATATGAATTA AGACATTTTA 
CAAGCGTTAA TGCAACGAAT CTTTTTAGTG ATCTTGCTCA CTCTTTAATA CTTTACCGTT 
CTTAGCATCA ACAGTAACTT CTTGTTTTTT ATTACCTTTT TTCAAATCGA TATTGTAAAC 
AAGTTTGCCA TCATCTTTTT CAAGTGACCA TTCTTTAATA TCACCATCAA ATTCTTTTTG 
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10 



IS 



20 



25 



30 



35 



ATTCATTGTA TCTTCTTTTT CAGTCTTTTT GTTAATCACT TTTTTATTTT TATCAGCAAC 
AAGTACTTCT GACTCTTCAC CAGATTTTTG TTGCGTCACT TTATAAGCCC ATTCACCATT 
AGAATTTTCA AATGAAATTC CTTTCAACTT TTGGCCTTTG TAAGTTTCTT CAGCTTTTTT 
CACAGCATCT TCTGGGCTTG TTTTAACATC TTTTAAAGCA ATAACATCTT TTGTTGTATT 
AGTGTCTTGA TTAGTATTTG ACTCTGTTGA TTTTGTTTCA TCTTTTGGAG TATCATTGCC 
ACATGCAGTA AGCACCACCG. CTGACATTGA TAACACTGCT AATGATTTTA ATTTCATAAT 
ATCACTCTCT CTTCCTATTT TTGAAACTCA TAACAAAAGC TTATATGCTA TATAGATTGT 
ATTACCCCTT GTTrTTAATT TTATTCATAA TTATTACAAA TATTTTTAAA TTAATCGTCA 
TGdOTTACTT TCGTTCGTAC TCCTTTTATA AATGAACCAT GTAATATAAG CATGCTATTA 
TCGACTCAGT TTGTCTAATG CTTTCTTTGG TACTTCTTCC TTTTCAACTT CTTCAAAAGT 
TTCTACATGA TGACCTTTAT GTGTAATTTT CAAGTATCTA TGCGGTTTAA CATCAAATGT 
AGCAGTATAC ATTAATTGCG TCTCTTTCCC TTCTTTATTA AAAACACTTT GACTATAACT 
TCGGAGTTGA TCATCCATTC TAGTAGACAC CTCTGTCGTT TTAACATAAG AATCATCCTT 
CTTTACTAAT GGGTTAAATT GATCTGTTAT ACCATGGOAG TCTATTGTTT TTAAAATGAA 
TAAAGCAgCA TAAGOGCCAA TGATAGTAAG TACAAGATAt GTkATTGTTT TTAAAATCGT 
TTCAAAAGA 

(2) INFORMATION FOR SEQ ID NO: 417: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 813 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



X260 

1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1600 
1860 
1920 
1980 
2040 
2100 
2109 



40 



45 



SO 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 417: 



GTTACATAAA TGAAAACAAA AAAGATAATT 


TTACTGCTTA 


TGCTACACCA GAACATAATT 


60 


ATCAATTTGG 


TGGTGCTATG 


ATAGAAAGTG 


AAAAATTAAG 


CGAGTTACTA AAGCCAGCCA 


120 


ATCAGTTAAA 


ATCACCAGAT 


GATATAAAAA 


AAGAACTAAA 


TAAAAAGAAG AGTCACTAAA 


180 


GTTAGGAGTT 


ACTTTAATGT 


CCAAAAAACA 


TGTTTTTATA 


ATTATTGGTG TCATATTGTG 


240 


TATATGTACA 


GTTTCTACGG 


TCATGCATTT 


TAAAATGAAA 


TATGATGAAA AAGAAAAACA 


300 


AAAAGCGATT 


TACTACAAAG 


AACAACAAGA 


ACGTATTACA 


CTCTATCTTA AGCATAATAC 


360 


TAAAGAAACG 


AACACGATTA 


AATCTGTACA 


TTTCACAAAC 


TTGGAAACAA GTCCTATGGG 


420 
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ATCGCCTGAA CATAATTATC AATrTGGTGG CGCTATGATA AAAAGTGAAG GAGTAGATAA 
ATTATTAAAA CCAGCACATG AAAGAAAATC ACCAGAAAAA ATCAAAGAAG AATTAGATAA 
AAAAGAAGGC CACTAGGGTC TTCTTTATTT TTGATTTAAT CTTCCAATAA TCTATGTCAT 

TGCTATCGAA ggtgtttcgc aattaatata aatcacttca tcatcaccaa tacttcccca 

GTTTTGTACA GTACATTAAC ACAAACGAAC CACXjITAATT TAAATGGAwT AaTAGTTTGG 
CCATTATAAG AACAATATAT ATCGAnTAAC AAT 
(2) INFORMATION FOR SEQ ID NO: 418; 

(i) SEQUENCE CHARACTERISTICS; 

(A) LENGTH; 640 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 418: 
AAAAGCAATC GTTGGTGGTG CTAAATTCAT CGGCAACTCA TATGTAAAAG CTGGTCAAAA 
TACACTTTAC AAAATGAGAT GGAATCCTGC ACATCCAGGA ACACACCAAT ATGCTACAGA 
TGTAGATTGG. GCTAACATCA ATGCTAAAAT CATCAAAGGC TACTATGATA AAATTGGCGA 
AGTCGGCAAA TACTTCGACA TCCCACAATA TAAATAAGCA ACATGAACAT AGGATCAAAA 
GTCATCCCCC ACTATCAATC ATGGGGGATG ACCTTTGATC CCTTTTTTAT ACATACACAA 
GCAAAAATAG CGGTGATTGT TTACCATCAA TTTTAACAAT CACCGCTACT TTTGCTTGTA 
ATTCATGATT CAATTTTTGT TGTGTGCACA ACGACACTAA ATTATGTGTT TGCTATTGTC 
6TGTTACAAC GATATGCGTC GTTGATTTAA CTTATCAAGT AATTGATTTA AATTGTCTAA 
TTCGACTTCC GATAAACATT GACATCTTGC TTCAATCAAT TCGCAACGTG CATTATTTAT 
TTGTGAAATT AATGTACGTG CTTGATCAOT CAAAATTAAT TCTTTACATC TTAAATCTTC 
GCTAGATTGT TGACTTGTGA TGTACCCnnT CAAAACTAAT 
(2) INFORMATION FOR SEQ ID NO: 419; 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1159 base, pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS; double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 419: 



1318 



EP 0 786 519 A2 

TTCTTGGATA CGTAATAAAT TACCTTTTGT CATAGGATTA AACATAGATC CAGGTAAAAC 

ATAAACATTT CTATTTTGCT CTAATGCAAA ATCTATCGTG ATGTGACTGC CACTTTGTTC 

CTTAGCCTCA GTAATTAAAA CCCCTTTTGA CAAACCGCTG ATAATTCTAT TGCGCTCAGG 

AAATCTATAT TTAGCGATTG GTGTATGTGG TGGATATTCA GATATAACTA AACCTTTTTC 

TTCTATTTTA TTTCTTAATG CTAATGTACT TTTGGGATAA TGTGTTTGAT GGCCAAACGC 

TAAAACTGCA ATTGTAGGGA GATTGTATTT TAAAGCTATT TGATGTGCCA TTGCATCAGC 

TCCTTGAGCA AGGCCGGAAA CAATTGTTAA ATATTTGCTT TTATCATTTG ATAATAAAAA 

TTCTAAAGAC TGTTGGGTAT AACTTGTAGA ATCTCTTGCA CCTACTACTQ CCAAATGATG 

CATATTATTT ATTAATTTGA TGTTCCCTTT ATAGAAAAGA AGTAATGGAA ATTGATATAT 

TTCTTTTAAT AGCACTGGGT ATTCAGAATC CATATATGTA ATGTAACTTA CTTTTAATTT 

CTGCAGTTCT TTAATAATAT CGTTATGATC AAGTTTTATA AAAGCATAGT ATTTACGTAA 

TAAATGAACA TTTTCTTCCC TATTCACCCA TTCACATAAA TAACTATCTT TTTTTCTTCC 

CTCCTCTTTA ATTACATTAG GATATGCCAT TAAAAATTGA TGAATTTGTT TAGTCGAAAA 

GTGTGCCCAS TATAACTTAA GCAAAAATAG TTTAATCAAT AAATCAACTC CmTTGTAA 

TCATACAAAA TCATATTCTA TTTTTGTTTT ACATTTCTAA TACAAAAACA TTGTCGATGT 

AATGTTATTT TAAGGAGTAA AAATACTGAC TTAAAAAGTG AAAAGTATGT TGGAAAGAAT 

TTAAAATTTC AATTTCCAAC ATACTTTATA ATTAAACCTT ATAAATAAGT TTTGCAAATT 

TATATAGAAT TGGTCTTACT GGTTTGATGA AATCACCAAT TAATTCTTCA ACATGTGCAT 

TAAAACCCTT TTTAAATTG 

(2) INFORMATION FOR SBQ ID NO: 420: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1879 base pairs 
<B) TYPE: nucleic acid 
(C> STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 420: 
TCAATCAGCG ACTACAAGAA GTGCGGGTCT ' TCAAACAATT GATGTGACAA CACTAAGTGA 
CCCCACTAAT ATTATCATGG GTATTTTAAT GTTTATAGGA TCTTCGCCAA GTTCGGTTGG 
TGGCGGTATT CGTACAACAA CTTTCGCTAT TTTAATTTTG TTTTTAATTA ACTTTAGTAA 
TAATGCCGAT AAAACATCCA TTAAAGTTTA CAATAGAGAA GTACACATTA TGGATATTCA 
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ATCAGCTACT 


GAAAATGGTA AGCTTACATT TTTACAAGTA TTTTTTGAAG TCATGTCTGC 


360 




ATTTGGAACT 


TGTGGACTAT CGCTTGGTGT CACAAGTGAT ATTAGTGATA TTTCTAAGGT 


420 


5 


CGTACTAATG 


ATACTCATGT TTATAGGACG TGTTGGCTTA ATATCATTTA TCATTATGAT 


480 




AGCAGGACGT 


CGAGAACCAG ATAAATTCCA TTATCCAAAA GAACGTATTC AAATAGGATA 


540 




ATATAATAGC 


AATCTAAGTT TAGTTAATGT AGATTTTAAC TGGAACTTAG ATTGCTTTTT 


600 


10 


TAGTTTGTAT 


rrrrAACTTA TrrXATAAGA cxsattggttt cgaaaatggt aaactagtaa 


660 




CAATGAGAGG 


TGTAACATGA TGGAAAAAAA TGAAAACATT AATGTAGAGA TTTTAACTAC 


720 


IS 


GTCAGATATG 


CATAGTCATT TCTTAAATGG TGATTATGGT TCAAATATTT ATAGAGCTCG 


780 




TACTTATGTT 


AACCAAGTAA GAGCACAAAA TCATCGCGTC ATITTATTAG ATAGTGGCGG 


840 




AAGTTTAGCT 


GGCTCGTTAG CGGCCTATTA TTATGCTATT GTTGCACCTT ATAAACGACA 


900 




TCCAATGATA 


AAGTTAATGA ACAGAATGCA TTATGATGCT AGCGGTGTGA GTCCAAGTGA 


960 




ATTCAAGTTT 


GGTTTATCAT TTTTAACTCG TTCAATTGCT TTGGCACGTT TTCCATGGTT 


1020 




ATCAGCAAAT 


ATTGAATACA ATGTTACTAA GGAGCCTTAT TTTTCAACTC CATATTGTAT 


1080 


25 


TAAACA'lTl-r GGTGACTTAA AAATTGCTAT CGTAQGCGTC ACAGCAGATG GTTTAATGGA 


1140 




AAATGAGTAT 


TCTGAAATGG AGCAAGATGT ATCTATTGAA AA6ACATTAG TGGCATCAAA 


1200 




ACGTTGGATT 


AGATATATCC ATGAAGTTGA AGAGCCAGAT TTTTTGATTG TAATTTATCA 


1260 


30 


TGGTGGATTG 


AATAAAATTA GTAATAGTAC GAAAAATAAA AAGGCAAGTT CGAATGAAGC 


1320 




TGAAAAATTA 


ATGGAAGAAC TCGGTGTTAT AGATiTAATG ATTACAGCTC ATCAGCATCA 


1380 


3S 


AACAATAGTA 


GGTCAAGATC ATGAAACGTA TTATGTTCAG GCTGGTCAAG ATGCCAAAGA 


1440 


GCTTGTACAT 


CTTTCGATTA ATTTTAAAAA GAGAACAACA ACTTATGATG TTGAAAGCAT 


1500 




TGATTCTAAA 


GTGATTGACT TAAATGAGTA TGAAGAGGAT CAAGAATTAT TAGATTTAAC* 


1560' 


40 


ATTCTATGAT 


AGAAAAGCAG TGGCTTATTG GTCACAGGAA ATCATAAGTG ATAAAGGTTT 


1620 


GATGTTATCA 


GTAAATGGGT TACAAGATTT AGTCTGTCAA ACACATCCAT TTTCGCAATT 


1680 




ATTACATGAT GCAATTCACC TTGCATTTGA TAATGATATA ACATGTGTCC ACGTGCCTAT 


1740 


45 


GaACGGAGAG 


AAGGGGTTGA GTGGACAGAT TCGAAATGAA GrTTTGTATC aTGCATACCC 


1800 




ATaTCCAGAT 


aAGCCAtGGG tATGACAATT aGTGGTCAAA ATaTCAAGGT ATnTTGGGGT 


1860 




ATAGTTATTC 


ACCATTAGG 


1879 


SO 


(2) INFORMATION FOR SEQ ID NO: 421: 





(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2710 base pairs 

55 
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(C) STRANDBDNESS : double 

(D) TOPOLOGY: linear 



10 



15 



20 



25 



30 



35 



40 



45 



SO 



(xi) SEQUENCE 0ESCRIPTI(»7: SEQ ID NO: 421: 
AATTCCCCCf TTTTCCCCAT CCATTTTnCC ATCCACTGGT CCTTACGGGA CCATATTATT 
TnAAATTGGA nAAAATTATt TTAAAGaTTA TwACtACTCT TtAATCATTT TrGTGAATTA 
AAAAAAGTAG TGCAAAAAGC AAAATATACT TTATACACTA CAAATCATTT ATTTATAATA 
AAGTTTCACC AAAAAATGTT CCAACTAATG AAACCGCTTG TTCAGCAGTA TGATTATTAC 
TGTCAATCAA TGQATTTACT TCAACTAAAT CCATTGAGGA AATTAAATGT GATTGATGCA 
GTAATTCCAA TGCAAAATGG CTTTCTCTAT AACTAAGACC ACCCAAAACT CTAGTACCAG 
TCCCTGGCGT TTCAAGCGGA TCTAAAGCAT CAACATCTAA AGATAAATGA ACGCCATCAA 
CATTGCGTGA CTTCAAATAT TCTATTGTAT TTTCAATTAC TTCCTTTATC CCCAATTTAT 
CAATATCTGA CATAGTAAAT GTTTTAATAT . TATGATCTTT GATAAATTGT CTTTCACCTT 
TATCTAAATC TCTCATACCA ATTAGTACX3A TGnTTTCTGG CTTGATTACA TTACnATTTA 
ATTCTAAAAG TTCTTTGGGA CCTTCGCCTG TCAAAATCCT TAGAGGCATA CCATGAATAT 
TTCCACTTGG TGACTCTTCA GGTATATTTA AATCACCATG TGCATCATAC CAAATAACAC 
CTAAATTATT ATAATGTTTA CTTATTGCTG ATACTGAACC TACCGCAATA GAATGATCTC 
CACCAAGAAC TAGAGGAAAT CTGTTATTTT CAATTGATGC TGAAACCTCT TTATTTAATT 
TTTGATTAAC ATCTATAATT TCATCATAAT TTCTTAATCC TTTTTGTTCA CTATGAAATT 
TTTCAATGTT CACAGCAGGt ACCTTAATAT CCCCCTTGTC ATATACATCA AGGTCTAATT 
GCTTTAATCT TGAAATTAAT CCAGCATATC TAATTGCTGT TGGTCCTAAA TCAACACCTA 
ATTTTCTTTG TCCAAATGTT GATGGTGCAC CTATAATATC AArTCCTTTT GTCTTTGTCA 
TAAGCGTCCC CCTTTGCTCT ATGTAATTAA AGAATAATGT ATGCGCTTAC CATTATCAAG 
CAATAGCTAC ACATATAATC TGrTTATCTT ATTACTTCAT AAAAAAAGGT TCTTCATCTT 
TTATGGTGGG AAGGTAAAAC TTCCTGCTTT TTTTAATACA CAAAAAGCGC AATTGCCTCT 
ATAATTTAAA GTGACCAAAC CCAAACTAAA GGAGACAAGT GCGCCTATGT GTAATGATAC 
CTTAGAATTA CTAAGAATAA AAGATGAAAA TATAAAATAT ATAAACCAAG AAATTGACGT 
CATTATCAAA GGAAAAAAAG CAACAGTGGT TAATGCTGTA CTAACGTATA AGCCTTCGGC 
CTG-I-TATTGT TGTGGAGTTA AAAATGAAGG ACAAATTCAT AAACATGGTA AGCGTGTTTC 
TCGTATTACT TTACTTAAAA CTCAAGGGTA TAACACATAC CTCAACTTAG CTAAACAACG 



60 
120 
160 
240 
300 
360 
420 
4S0 
540 
600 
660 
720 
780 
840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
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GTGTTTTATC TCAAGATGTG TTACTCAAAA AGTTATAGAA GAAGCTACTA AAGTTAAAAC 
AGAGATTGAT ACTGCAGAAG ATAACTGTAT CTCTCCATCT ACTGTAAGTC GTATTAGAAC 
TAAAGCGGCT AATTCATTAC GAATTAAACC CITTAATTGT TTGCCAGAAC ACATCGCTAT 
GGATGAATTT AAAAGCGTTA AAAATGTAAC TGGATCAATG AGTTTCATTT TTATAGATAA 
TGATACTCAT GATGTTATAG ATATTTTAGA AAATAGAACT ACAAGATTCT TGCGTGCCTA 
TTTCGAGCGA TTCGATTTAA AAAATCGACA ACAAGTTAAG ACGGTTACTA TTGACATGTA 
TGAACCCTAT GTCCGATTAT TTCGCGACCT ATTTCCTAAT GCAGCTATTA TTTTTGACAG 
ATTCCATATC GTTCAACATT TAAATAGAGA ACTTAATAAG TATCGTGTAC AAGTTATGAA 
TGAATACCGT AATAAAAAAG GACCTGATTA TACAATTTTT AAGAATAACT GGAAAGTCCT 
ATTGATGGAT ACTAGTAAAA CCATATTTAG TAAATAGAGA TGGAATAAAT CTTTTAAGGC 
TTATAAACGC TCATCTGACA TTGTAGAATT CATGCTTTCA AAAGACGATA TACTACGACA 
CTCCTACGAA CTTGTCCAAG GATTACGAAA AGACCTAAGG TTATGTAATT GGCCTAAATT 
TATTAATCGT TTAAATTCAG TTAGTAAAAA GTCTGTGAGT AAGGGTGTAT GGAAAGTGGT 
TAAATATTAT AGAAAACATC AAAGGATGTT AAGAAATACA ATTTATTACC CAGCATTTAA 
TAATGGTGCT ATAGAAGGAA TTAATAATAA GATAAAATTA ATCAAGTGAA TTTCTTTTGG 
TTACAGAAAT TTCAACAACT TTAAAGCACG TATAATGATG aTTTTCAGCT TGTACAAAGG 
AGaAAAAAAG AAGACAACCA AGCCCAATAA TGGACTGGCC GCCTAATAwA nGGGskCTAA 
AAGTTgTATT TTTAAAAATA GTTCCTTTAA ATTATATACC CnCCACATTT GGGGGAGGAC 
CTAAAAAAGC 

(2) INFORMATION FOR SEQ ID NO: 422: 
(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: io27 base pairs 

(B) TYPE: nucleic acid 

<C} STRANDEDNESS : double 
(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 422: 
CATTTTAATT GtTaAAATTC CAAAAAAtGT ArGTGGATTw AAAGrAAACC CtGTGTTTTT 
AAAAGGtACC ATTaAAATAg TTCCGATTGT ACCATCCCAC GTGAAAtTTT TAgTAtTGCC 
GGTGaGAGAA AATGCCAATG CAATCATCGC AGTTCATAAT CATCCATCCG GTGATGTAAC 
GCCCTCACAA GAAGATATCA TAACAACAAT GAGGTTGAAG GAGTGTGGTT TGATTTTAGG 
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GGGTTACTTT 


GAXGAAAATG 


ATTGAAGTTG 


ATAGAATTAA 


TGACGTATCT 


TGTGTATAAT 


ACCTACGAAG 


TACTTTCATT 


GGAGGAAAAA 


TAGTGACTCT 


ATTTATTATT ATCGGGGTTC 


TC6TGCCAAT 


GGTTTATACC 


ATGCAGTTAA 


ATATTAAAAA 


TGAACCTGTa 


ACAAAGCGCA 


ATCTTTTAAT 


AACATTAGCT 


TTATCTACGT 


TAGGTATTTT 


AGTAACCGGG 


TTAGCAGGTG 


TAATCGTTAC 


GAAACAAGCT 


TTTCCTTTAT 


TAAGTGTAGC 


AATTGGCTCA 


ATTTTTACTG 


GAATCGTTTG 


GGGCCTTTTA 


CTAAGTGGTA 


GcTACGCGCr 


GATACGATTT 


TTATCTAACG 


CATTTGGGCG 


TAAGTAATAG 


TAATCTGTTC 


ATCAAGTAGT 


ATCCGTGCTT 


GAAAACAAAC 


TAAAACTCCT 


AATGTGGAAC 


TAGTTAAAAA 


ATTCTAAACT 


AGTACATTAG 


GAGTTTTGTT 


ATGCA6AATA 


AATTTAATTG 


TTAAATTGAA 


AGTGCGGTAA 


AAATCCACTA 


TTTATTTGAA 


AAAAATCQAG 


CAACCAAATT 


AAACCTTGAT 


ATCCTAAGTA 


AATACATAAT 


AAAACAAGTC 


CGACATAAAT 


TAAAAATCGC 


AAAATAGAAA 


GTCCAACTCT 


AAAAAGGAGG ATGACTAATA 


GT6CTATTAA 


• 

AATAATTGTt 


AGTATACTCA 


ATGCTACAAA 


CCTCCTArTA 


CGCTTTTAAA 



TCCATAA 

(2) INFORMATION FOR SEQ ID NO: 423: 

(i) SEQUENCE CHARACTERISTICS: . 

(A) LENGTH: 569 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 423: 
CGGCACATTT TTAATTTATA CATATTTTAA AACTAAGTAA CAGTTTGAAG AAATCGTAGT 
TCAATAATGT TAATTGTGAA AATGTATATA AACATAAAAA AATCATGTAT AATATATGTT 
GTTAATTAAA CAGTTCGAAA GCGAGATGAC ATTATGGGAC GTAAATGGAA TAACATTAAA 
GAAAAAAAGG CCCAAAAAGA TAAAAACACA AGTAGAATAT ATGCGAAATT TGGTAAGGAG 
ATTTATGTTG CAGCAAAATC TGGTGAACCC AATCCAGAAT CTAACCAAGC TTTAAGGTTG 
GTGCTTGAAC GCGCTAAGAC ATATTCAGTG CCGAATCATA TTATTGAAAA AGCAATAGAT 
AAAGCTAAGG GTGCTGGAGA CGAAAACTTT GATCACCTAA GATATGAAGG ATTTGGCCCA 
AGCGGATCAA TGCTAATTGT TGATGCGTTA ACAAATAATG TAAATCGTAC TGCCTCTGAT 
GTGCGAGCTG CTTTTGGTAA AAACGGCGGT AATATGGGTG TATCTGGATC AGTTGCTTAT 
ATGTTGTCAT GTGGCCACAT TTGGTATTG 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3264 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNES5 : double 

(D) TOPOLOGY: linear 
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ixi) SEQUENCE DESCRIPTION: SEQ ID NO: 424: 
TGGACCTATA AAATGGATGC ATCCAAATAT GGATGnGGGG TAnGGCGGGa AAATAGGaGG 
TTATATAGTA AGTCATTTAA GTCGAATAGC CATCCTTTTT AAAATGAAAA AAATAGAAAG 
CTCAATAGTT TGTTAAAGCC TTTAAATAGC GTCGTTACGC AATTTTAGAA TGCTAAAAAT 
TGTCACAAAT TTCAAATTAC GTGCTAAAGC TTGAGATATC AATATTTATT GGCGATAGAG 
TGTAATTTGA CTCCGCTTAC ATCTCAGTTT TATGTTTGTA ATTTGGTAGC ATAATATTAT 
AATAAAATAA AATTGTTAAT CTTTAATTTC AGTATAGATA TTTTTACGTG TAGTCACGTG 
TAAAATAAAT TCAATTAGGT TAGGAGACAT AATTATGAAA ACATTTGGTA AAAAGGTTGT 
ATTAATCGGA GATGGATCTG TAGGATCAAG CTATGCCTTT GCAATGGTTA CGCAAGGTGT 
TGCTGATGAA TTTGTAATTA TTGACATTGC AAAAGACAAA GTAAAAGCAG ATGTTCAAGA 
TTTAAACCAT GGTACAGTCC ACAGTCCTTC ACCAGTTGAT GTGAAAGCAG GTGAATACGA 
aGaCTGTAAA GATGCAGATT TAGTTGTTAT TACAGCtGGT GCACCTCAAA AGCCAGGTGA 
AACACGTTTA CAATTAGTTG AAAAAAATAC TAAGATTATG AAGAGCATCG TTAAGAGTGT 
TATGGATAGT GGCTTTGATG GATATTTCTT AATCGCGGCA AACCCTGTAG ACATTTTAAC 
AAGATTTGTA AAAGAATATA CTGGATTACC AGCAGAGCGT GTTATCGGTT CAGGTACTGT 
ATTGGACAGT GCACGTTTAC AATATTTAAT TAGCCAAGAA CTTGGTGTTG CACCTTCAAG 
TGTTGACGCT AGTATTATTG GCGAGCATGG TGATACTGAA CTTGCAGTTT GGTCACAAGC 

• * . - ■ • 

AAATGTAGCA GGTATTTCAG TATATGACAC ATTAAAAGAA CAAACTGGTA GCGAAgcTAA 
AGCGGAAGAA ATTTATGTGA ATACACGTGA CGCTGCTTAT GAAATTATCC AAGCTAAAGG 
GTCAACATAC TATGGTATTG CATTAGCATT GATGCGCATT TCAAAAGCCA TTTTAAATAA 
TGAAAATAAT GTCTTAAATG TTTCTATACA ATTAGATGGT CAATATGGTG GTCACAAAGG 
CGTTTACCTA GGTGTACCAA CATTAGTTAA CCAACATGGC GCAGTTAAAA TTTATGAAAT 
GCCATTAAGT GCCGAAGAAC AAGCGTTGTT CGATAAATCT GTTAAAACAT TAGAAGATAC 
ATTTGATTCA ATTAAATATT TATTAGAAGA CTAAGCCTAT TTTAAGTATT AATTAGAAAT 
ATATTAATGG TAAGAGGATC TATTAGTGTT GCAGTAACAC GTGGCACTGA TAGGTCCATT 
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TATGACTCGT GAAAATTTAG TGACATGAAT AAAAATGTTG AGGCGTCATT GAGTATAAAG 
GAAAGTAGTT CTGCATTAAT CACGAaGTAG AGCATGACmA CGAGGAATAA CTATAGGGaG 
ATGGTTTTGG AATGACGAtG TCITGTATCA ACATGGTACA TTAGGTACGT TAATGGCTGG 
CTTACTAGAA GGCACAGCTA CAATTAATGA ATTGTTAGAA CATGGGAATT TAGGGATTGC 
AACGTTAACA GGGTCTGATG GCGAAtAATA TTTTTAGACG GAAAGGCATA TCATGCTAAC 
GAGCATAAAG AATTTATAGA ATTAAAAGGC GATGAGAAAG TACCGTATGC ATCGATTACT 
AATTTTAAAG CGAGTAAGAC ATTTCCATTG CAACAATTAT CACAAGATGA TGTATTTGCA 
CAAATTAAAA ATGAAATGTT AAGTGAGAAT TTATTTTCGG CTGTTAAAAT TTATGGCACA 
TTTAAACATA TGCATGTACG AATGATGCCT GCTCAGCAAC CGCCATATAC ACGTTTGATT 
GATTCAGCAC GCAGACAACC TGAGGAAAAA AGACAAGATA TTCGTGGTGC CATTGTTGGA 
TTTTTTACAC CAGAATTATT TCATGGCGTA GGGTCTGCTG GTTTTCATAT ACATTTTGCG 
GATGATGAAA GAGCTTATGG TGGACATGTT CTTGACTTTG AAGTCGATGA CGTTGTCGTT 
GAGATACAAA ACTTTGAAAC ATTCCAACAA CATTTCCCX3G TAAATAACGA GACGTTTGTT 
AAAGCGAAAA TAGACTATAA AGATGTGGCA GAAGAAATTA GAGAAGCTCA ATAGTCTAAT 
ATAATTAAAA GACCTTAGCG ATATTAGGAA CAGGTGGTTC TAAATGCATC GTTAAGGTCT 
TTTTATATTA TATATGTGCT TACATATTTT GTTGATACGC GCGTAAAAAG CTATAAATAG 
TATCAAGATA TGGGGTGTCA AGAATGTGTT CACGTGCACG TCGATAAATA AAGCCTTGAA 
TCGCTTCGAC TTCAAGAGGT TGCTGATGCG CAATGTCGTA ATACATGCTC GTTCCCATTT 
CGTCGGGATA ACCTTGATAT ATAGTCATAA TAGTATCGAC AGTTTGTTCT GAAAAGTTTA 
ACCCCTCTGC CTGTGCAACA CGACAACCAT CTAGTAATAG CTGTCTACAC AGTGTACGTA 
TTTCAGGATT ATGCATGATT GCAACGGTCT GTCTACCGAG TGCTGTGATA GAATTAATGC 
CCAAGTTAAC TAACAATTTA TACCAAATAG CTTGTTGAAT ATTTGCTTCT AATACAATGT 
CGATTTGACT GTCTTGGACC AAATCTCTAA ATTGTCGAGT TAATGCATTA TCTTGTATAC 
GTAATTGATA ATCTCTGAAG TGCGTAACAA CATCGCCTTT CTTTTGACCA CTTATATAGA 
CAACTGCTTG GCATACGTTT TTAAATGAAA TATGTTCXSAG TTGACCATAA CCATTTTGGG 
CTAAAATGAT GAGCGTGTCC TCATGTGCAA GATGAGTTAA ATGAGGAATA ACTGCATCAA 
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GTTGATGTGT TTTGACTGCA ATAATAATAA CATCAAATGT GTTTGTGACA TCTTCATAAC 3120 
CTTTCACAAC AATATCTTGT GCAGGTGCAT GTGGTACAGT ATAATATGTT ATTGTTTTGG 3180 
CGTGTCTCCC GATAAGCGTT GTATGAGGCA ATGATTGTTG TAATTCATAG GCAATAGTTG 3240 
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(2) INFORMATION FOR SEQ ID NO: 425: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 796 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 425: 
AGAACGAACC TTTAATACGT ACGTGTCGAC CACGAACTGT CATGACAAAT TGATAAAACG 
AATAGTTTTT CATTAGTTCA TTGTCACATC AATCACTTTT GTkTCACCTT . TAATCACAGC 
ATTTTCATCA TAAATATTAA TTGAAGCTGC TTGATCAGTG TTAGTAATTA TAATTGGTGA 
AATTACAGAT TTAGCGTTAT TATTAATATA TTCAAGGTTG AATCTTACTA ATGGATCTCC 
GACGTTAACT TCGTCACCAC TAGACACTAA CACTTCAAAT CCTTCACCGT CTAATTGAAC 
TGTGTCTAAA CCGATATGAA CTAATAATTC TAATCCGTTA TCTGCTTTTA -ACCCAATCGC 
ATGCTTAGTT GGAAAGACAT TGTCAACACG TCCTGCAATT GGAGACACAA CTTCTCCTTC 
AGmSGATTA ATACCAAAAC CTTCGCCCAT CATTTTTTGT GCGAATACAG GATCTGGAAT 
ATCTTCAATT TTCACGAATT CTCCAGTTAA TGGTGCATAA ATTGCGATAT CTTTCTGAAC 
TTCTTTGCCT TTTCCGAATA ATTTTTTAAA CATACTTTCC ACTCCTACTT ATCAAAATGT 
GATATTAAAT CGCCATAACC CAATTCTTCT AACTrTTCAT ATGGAATAAA TTGAATTGCA 
GCGGAATTGA TACAGTATCT TAAGCCGCCA CTTTCTTTAG GTCCATCATT AAAGACATGT 
CCTAAATGAC TATTTGATTC TTCTGAACGC ACTTCAGTTC TCAACATACC AAATGATTTG 
TCGACTAATT CTATAA 

(2) INFORMATION FOR SEQ ID NO: 426: 
(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 33 93 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 426: 
ATCCAGCAAA TCTTTCTTAT CACGTTCTGT AATTTTCTTA GTATCCATCT TGATTAGCTT. 
TGATAACTTT TCAGCCGTAT CCAACATTTC CGATTGTGTT GTTTTTCGAC CCCTAGTATA 
TGTAATAGCC ATTTTAGAAG CATTATCAAC TAAAACTTTC CCATTTCTGT CTAAAATACG 
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ATGTGAGCCT TGTGCGATTT GTAAATAACC TAAACGTAGT ACTAGTACTG CAAAAATAAA 

• * - ' 

TACAATCACA CCAAATATAA AGTTAATTCT CTTGTTAATT GTATTTTGAA CGATTTCATC 
ATTTCATTTT'tCTTTTAGTC TTTTTAACAA AACTACCTAC CTCTATTCAA AGTCTTTCAC 
TTTAAATCAT ATATGAATTT AGAAATTATT TCTATCTTTT TGACAAAAAA ATAACGGTCT 
CATTtAAGAG ACCGAACAAG TAATCATACT TTATTTTGTT GCATTATATA ATTCGTCAAC 
TTTTTCCCAG TTAACTACAT TCCAAAATGC GCCAATGTAG TCAGGGCGTT - TGTTTTGATA 
TTTTAGGTAA TAAGCGTGTT CCCATACGTC TAAACCTAAA ATAGGTGTTT TACCCTCAGT 
TAATGGATTA TCTTGGTTTG GTGTAGTCAC AATTTCTAAC TGGCCATTGT TTACGACTAA 
CCAAGCCCAA CCTGAACCAA AGCGTGCAGC TGCTrPGTCA GCAAATTCTT TTTTAAATTC 
ITCTAAAGAA CCCGATTGTT CTTTAATTTT TTCTACTACA GTACCTTTTT CTTCTGAGTT 
TGGTGAAAGT AACTCCCAGA ATAATGAATG GTTTAAATGT CCACCGCCAT TATTACGTAC 
AGCAGTTTGG ATGTTAGCTG GTACACTGTC TAAATTAGCA ACAATTTCTT CAATAGATTT 
AGATTCTAAA TCTGTrACCTT CTACTGCAGC ATTTAATTTC GTAACATACG TGTTATGATG 
TCTGTCATGG TGAATTTCCA TAGTTTCTTT GTCAAAATGT GGTTCTAATG CATCAAATGC 
GTATGGTAAT TTrGGTAATT CAAAAGCCAT AAATAATCAT CCTCCTAAAA TGTCTGTAAG 
TAAATAATAA CAAGCAGTGA CTGGTTCAAC AAAGAATTTG CTTAAATTCT ACTACTTATT 
ATTTTCTCTA CTCATTTAAT ATAACTCAAA TCAAAAATAA TTAAACATTT TGTATATAAA 
AAGTTAACAG ATTTGCCATA AAATCATACG AACGGAGTAT GAAATGAACC TTTATCTTCT 
ATAATTTAAA AAATGAGATT TATCCATACA TCGGACCAAA TGTGCATAAA TCTCATTTCT 
TTATATTAAT CTTGGCAAGA CTCACATACA CCATAAACTT CAAGTTTGTG TTTGTGAATA 
TTAACACCAG GTAGTGATAA TTTTATCTQA TCTATTGGAC AATAATCTAT TACCTTTGTA 
TCTCCACACT TTTCACAGAT AAAATGATGA TGATGATGGT TTGTACAAGC GATTCTAAAC 
TTCATTTCAC CATCAAGTTC TGTATTTTCA ATAATTCCTA AATCTTTAAA TAAGTGCAGG 

rrrCTATATA ttgtgtcgaa tgaaattcca .ggataatttt catccataac ttgttgtata 
tactttgcgt ttatatactt atcttcttcg acaaaaatat ctaacatatc tttacgttta 
tctgtatatt ttaaaccgtt ctcttttaaa ATTTTAATAG catcatttgt attcattgat 

ATTAGCTCCC TTTTTAAACT TCATTCGCAT TTTCTGATAA GCCATTGTAA TCATAAGTAA 

aataacaagt agaactacaa ttacaccacc cggagaaatg tccatataga aagctaggac 

TAAGCCTAAT ATTACTGATA ATTCACCTAA AAATACACTT AGTAATATCA ATTGCTTAAA 
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TATCCCTACA ACACGCATTG AGGCAGAAAT AACCATCGCT ACAATAACAA TAAATAAAAA 
TTGAATCCAT TTAGGAATGC CAATGACTTT ACTATATTCC TCATCAAATG ACAATATAAA 
TAATTCTTTA TAAAACAATG TAATAAACAG AACAACTATG ATGGCAATGA CAATAATCGT 
TGTTAAATCA CTTATATTCA CTGCGCTTAT TGAGCCAAAT AGCAATCCAA CAATTTCTTG 
ATTGAACCCA TCAGCTAATG AAATGAAGAT TGCACTCAAG GCGATACCAG CACTCATTAT 
AATTGGAATA GCAATTTCTT GGTAAGCAGT GTATGACGTT CTTAATTTTT CAATTAGAAG 
CGCACCTACT ATTGCGAATA AGATTCCAAA CCACATTGGA TTAATAAATA CTAGTGTTGG 
CATAATAGTA AGTAAAAACA TACCGAAAGA TATACCACC7 AAAGTTACAT GACTTAGAGC 
ATCAGCTwTA A6TGATAGTC GTCTAACAAc GATAAAAGCA CCGaTTAGAG GCGCAATAAA 
ACCTAtCAAG ATAcCACTAA TTAAAGAGTA CCTCATAAAA TCAAAATTCA AXAATGCATC 
TATCAATTGT GACACGCCTT TCCATTTTAA ATAAACTCAA ATCTTTATTA ATTACAACAT 
TCTCGATTAT GCTGATGATC GACAAAACGT ACAGGATGTC CATAAATTTT TGAAATTTCA 
ACTTCATCAA GTGATTTAAA CTCATCAGTT GTACCATGGA AATGCAAATG CTTATTIAAA 
CATGCTACTT CAGTAGCAGT ATCTGCTACA ACACCGATAT CATGAGTAAC TAAGATAATG 
GTGATACCTT CTTGTTTTAA TTGATCTAAA GTATTATAAA ATTCACTTAC ATGTTTTGCA 
TCAATACCAT TCGTTGGTTC ATCAAGTACT AATACTGcAG GTTCTGAAAT CAATGCTCGA 
GCAATCATXa CACGTTGTTG TTGACCACCT GATAATTCTG . CTATATTTTT ATGAATTAAA 
TCACTTATAT TCAGTCTTTC TAGTACTTTA ATCACTTTTT CATTATCTTT GCTATTAAAT 
GTTTGGAAAA GACGTTTTGT CTTTGTTAAT CCGCTTAAAA CAACTTCTTT AACACTTGCT 
GGGAAACCTG AATTAAAGGC ATTTGCTTTT TGTGATACAT AGCTTAATTT AATTGATGTT 
TcTTATTTTT AAAATCAATA CCTTCAACAA AAATCTCACC ACTTTGTAAA GGTAATAACC 
CTAGAATCAA CTTCAATAAT GkTGATTTAC CAGCACCATT TGGkCCAACA AwTGCtAAAA 
ATTCACCTTT ATTTATTTTG AATGnnnTAT ATT 

(2) INFORMATION FOR SEQ ID NO: 427: 

- - ■ . • • • . • - • • 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1123 base pairs 

(B) TYPE: nucleic acid 

.(C) STRANDEDNESS : double 
(D) TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION: SEO ID NO: 427: 
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CCCTGTTTCT 


TAGCCTTTTC 


GTATATGCGT 


TCATAAGAAG 

• » 


AATTCrmT 


GATTTCAGAT 


120 




TGTAAAGCAC 


TGTTTTCACT 


TGATTGTTTA 


TCTATTTTAT 


AATCTAAATC 


TGCAATCTTT 




5 


CCTCGCGTAT 


CATACGCATC 


CATTTTTAAA 


GATAGCATAT, AAATACTTAA 


CATAGCAATT 


240 




ACAGTAATCA 


AAGTTATGTA 


TAAAACTTTT 


TCAAATTTAG 


TTAATTGTAC AACCACTTTT 


300 


10 


CTCGAAACAG 


TCTXCTTTTC 


GGGCTTAGTT 


TGTOGTTGTT 


QCTTCGGTAT ACTATTATAA 


360 


ACTTGTTCGX 


CATATGCrTG 


GTACACTTTT 


TCTACAGCCA 


TTATAAATTG 


CTCCTTATTT 


420 


- 


AAGTATTTCA. 


GCTACACXJTA 


ATTTCGCGCT 


TCGTGCTCTG 


TTATTGTCAT 


CTAAATCTTC 


4ao 


IS 


TTCTGTAGCG 


GTAATCG6TT 


TACGATTAAC 


ACGCTTTAAC 


TTAGGTGTAT 


ATGCTTCTGG 


540 


TATAACTGGT 


AATCCTCTTG 


GTACCTCTGG 


ACCTTTTTCA 


TATTCTTGQA ACACCTGTTT 


" 600 




ACATAAACGA 


TCTTCTAAAG 


AATGGAAAGT 


GATTACCGAA 


ATCCTGCCAT 


CTACTTTCAC 


660 


20 


TAATTCAATC 


GCTTGTTCTA 


TTGAATCTTC 




AATTCATCGT 


TTACTGCAAT 


720 




TCGTAGTGCT 


TGAAATACTC 


GTTTTGCAGG 


ATGTCCGCCT 


TTTCTTCTTG 


CTTTXGCAGG 


780 




AATACCTTCT 


TTTATAATGT 


CAACTAATTC 


TAATGTTGTT 


GTTATTGGTT 


GTTGTTCGCG 


840 


25 


ATGTGCTTCG 


ATTCTTCGAG 


CTATCTGTTT 


TGAAAATTTC 


TCCTCGCCAT 


AGCGATAAAA 


900 




AATCTTCACT 


AACGCTTCAT 


ATGACCAATT 


GTTAACAATT 


TCATATGCTG 


TTAGTTCTTG 


960 




TGTTTGGTCC 


ATACGCATGT 


CTAATGTTGC 


GTCATGGTGA 


TAACTGAATC 


CTCGTTCTGG 


1020 


30 


AATGTCGAGT 


TGTGGGCTTG 


AAACACCCAA 


GTCGTAATAA 


ATTCCATCTA 


CTTTTTCAAT 


1080 




GTTTAAGTCT 


TTTAATATTT 


GAGTTAATTC 


ACGGAAGTTG 


CTA 




1123 



(2) INFORMATION FOR SEQ ID NO: 428: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 838 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

40 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 428: 
TATATCCTCC AnACCATAAA AATGGAATTA TAGTGAAGAC CGCTATGATC CAGGATGACC 60 

45 

ACGTATTATA GAATCTTTCg . ATAGAGAAAC GAATCaACGT ATCCgACATC aCGAAATGAA 120 
ATTAGAAGAT TATAAAGATG AGTTAAGAAG . AGAATATCTA AAACAATCTG ACAGAATTGA 180 
AGGAGATGAA TAAGCGTGGG ACTTGATTTT AGTGGTTTAC CAGATTTAGC AGTATTGGAA 240 

SO 

CAAATGAAGG AAAAAGAACA GATTAGTGAG GTTATTGCGC CTGAACATGT TCGTATGCAT 300 
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CATTTCAAAA AATTTGAAGA TGATTTTAAA AATGCGGCAC AAGGGGCTTG GGTGAAAAAT 
GCCACAGACG AATTAAAAGA TATTAGTAAT GATTTAGAAA AAATTCAAGA TATTAAAGTA 
TAAAAAGGTA TTAAGAAACA CAATAAGTAT ATAATCCATT TAATAATAAA TGAATTATAT 
AGTTCATAAT TTCGACTATA AGTGGCTATT AGCCATTATT TTTCGGGATC TATGTCAAAT 
CGGACTAATG AATTCAATAA TGGAAGTTAA GCAACCAATC TTTGTTTAAC TTCrTTTTTA 
TTTTTTGGAA AATAAAGTTT TGAACATAAT AAAATTTGAT TATGTTTTAA CXSAATTTTGA 
TGTTTCTTGA ACTATATATC ATCTAGTCGT CATTTACAAT TGGTAAATAT GACTTCAAAC 
TGkATGAAGG TGATGGCGAT TAAAAGGCTC ATCCGTAGGT TCTAAAGAAC TAGAnTTT 
(2) INFORMATION FOR SEQ ID NO: 429: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1150 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : doiible 

(D) TOPOLOGY: linear 

(Xi) SEQUENCE DESCRIPTION: SEQ- ID NO: 429: 
nGTGTTCAAA TAATAGAATG GCTAATACCC CAACAATAAA TAGGAATAAA TATGTTGATG 
TCGTAATTTT AGTAAATAAT GAAAATCTAA AATTAGTAAC CCTATTTTGA ATATAAGCTT 
TAACTTCTAA TAATACTGGG AAGCCGATTG ATCCTAAAAT TATTAAAAAT ATAACTATCG 
CTTGTACAAA ATAATCATGT GCATAAGGAA TTAATGACIT ACCTGTAATA TCTAATCCAC 
CATTGGTAGT GGCAGAAATA GAAACAAAAA CACCTTGCAT GATTGCATAT TTTAAATCTG 
GATTATCTCG ATAAAAGTAA AATGCTAATA ACATGGCTCC TACGAGTTCG ATTACAAATA 
TTGATTTTAC AATATCAATA ATCAATTTGA CGGTACCACT CATTGTGTTT TTGTTATTAT 
CTAACATAAT TAACTGACGT TCTCTAATTC CAATATGTTT ACCTAGTACC ACCCATAACA 
TCGTACCAAT TGCCATGACG CCAATTCCAC CAATATTTAA TATCACGAGG ATAATTAATT 
GTCCAAATGT AGAATAGGTA TCGACAATAC TTATCGGAGA CAATCCAGTA ACACTAATTC 
CGGATACGGC AACAAATAAT GTGTCAATTG GATTTACTTC TACACCTGGT TTATGcACAT 
ACGGTAAGTT TAATAATAAA AATGCAATGA CAATTGCGAC GATATAGTAC AATACAATAC 

CTTGTTGAGG GCTTGATCTT TTTAAAAACT GGCTAAAAAT TGACACGTTG TTCACCTCAA 

- • 

CATTATTTTA GTTTAATATT AATTTCTTTC TCTTTACCAT CTCTATAAAT CTTCGCTGTA 
ATTGATTTCA AGTCATCTTT ATGACTAAAT ATAATCTGCC TAAAGCGTAA ATCATCTTCT 
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AAACCATTGT TGTCAACTTG ATCTACAACA ACACCGTTCT TAACTTTTCC TGGCAATTTA 
ACTGCTTGTC TTTCAAAACT ATTTAGACTG ACAATATTCT TCATTTTAAC ACCTACATCG 
GGATAGTCAA tTTTACCTTT tGTTTCTAAA TCTTTTACAA TCTTTtGTAC TTCATTAaCA 

4 

GGCATTGCAA 

(2) INFORMATION FOR SEQ ID NO: 430: 

ti) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 797 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEONESS : doiible 

(D) TOPOLOGY: linear 



1020 
1080 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 430: 
AAGAATATTT AGGATTTTAT GTTTCGCAAC ACCCAGTAGA TAAAAAGTTT GTTGCCAAAC 
AATATTTAAC GATATTTAAA TTGAGTAACG CGCAGAATTA TAAACCTATA TTAGTACAGT 
TTGATAAAGT TAAACAAATT ' CGAACTAAAA ATGGTCAAAA TATGGCATTC GTCACATTAA 
ATGAXGGCAT TGAAACTTTA GATGGTGTGA TTTTCCCTAA TCAGTTTAAA AAGTACGAAG 
AGTTGTTATC ACATAATGAC TTGTTTATAG TTAGCGGGAA ATTTGACCAT AGAAAGCAAC 
AACGTCAACT AATTATAAAT GAGATTCAGA CATTAGCCAC TTTTGAAGAA CAAAAATTAG 
CATTTGCCAA ACAAATTATA ATTAGAAATA AATCACAAAT AGATATGTTT GAAGAGATGA 
TTAAAGCTAC GAAAGAGAAT GCTAATGATG TTGTGTTATC CTTTTATGAT GAAACGATTA 
AACAAATGAC TACTTTAGGC TATATTAATC AAAAAGATAG TATGTTTAAT AATTTTATAC 
AATCCTTTAA CCCTAGTGAT ATTAGGCTTA TATAACTTTy ATCAACTAAT AAATTATGAT 
ATAGTAAACT GATGGTTAGA TATTTyTyAA CCATCAGTTT GCGTktATAT TAGTTTTTTA 
TGCTTATTAT TTTTATGAGT TTCACTTTAC ATTATTGATT AATCCATAAG AATAATTAGC 
ACAAAAAGCA GTATACATAA ATTGAGTAAA GAATTTTGTC GATATAACCG nGCGGAAAAA 
TAATAACnTT TTGGATn 

(2) INFORMATION FOR SEQ ID NO: 431: 
. (i) SEQUENCE .CHARACTERISTICS: 

(A) LENGTH: 1466 base pairs 

<B) TYPE: nucleic acid 

(C) STRANDEDNESS : double - . . - 

(D) TOPOLOGY: linear 
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TTTCCAAGAG AAGTTGCGGA AGTAATTAAT AAAACGCATC ATAATAAATT GGTCATTTCG 
ATGATTTCGk CACAAATCGA TGCGGATAGA ATGGATTATT TACAACGTGA TGCGTATTTC 
ACAGGTGTAT CATATGGTGC TTTTGATATG GAGCGTATTT TAAGATTAAT GCGACCTTCT 
AAAGATGAAG TACTAATCAA AGAAAGTGGT ATGCATGCAG TTGAAAACTT TATTATGAGT 
CGTTATCAAA TGTATTGGCA AATTTACTTC CACCCAGTTA GTCGTGGTGG AGAAGTGCTG 
CTTAATAATT GtTTGAAACG CGCAAAACAG CTTTATAATG AAGGCTATGA ATTTAAGTTG 
CATCCACATG ATTTTATTCC ATTTTTTGAA GAGACAGTTA CGATTGAACA ATATGTTGAA 
CTCGATGAAG CGGTAGTTAC GTATTATTTG GAAAAATGGA CAAAAGAAGA TGATGCTATT 
TTAAGTGATT TAGCAAGTCG ATTTATTAAT CGAGACTTAT TTAAATATAT TCCATTTQAT 
GGCTCAATTA TTACAATATC AGAACTGCAA GAACTGTTTG AAGCAGGTGG TATTAATCCA 
GATTATTATT TTGTGAGTGA AGCATTTTCT GATTTGCCAT ATGACTATGA TCGACCGGGG 
TCAAATCGCA AACCGATTCA TTTAXTAAGA CAAGATGGTA CGATTAGAGA AATAAGCAAT 
CAATCATTAG TCATTCATAG TATTACAGGC ATTAATCGCC AAGACTATAA ATTATATTAT 
CC7AGAGAAA TGGTTGCAAA GATTAAAGAT AAGACAATTA GAGAAGCTAT TGAAAATTTG 
ATTAATGAGC TTAATTAAAC AGGGCTAAAA TTGTTATCGT TAAATATGGA GGTTATATCA 
TTGTCTGAGA AAAAAGGCTT TAATTTTAAT ATCATAAAAA ATGACCCTCT AGATGGTCAT 
AAAGGTACAA ATATTGGTTC AATTAGCTTA GACAATATTG CACCAGTTTT TATCGATGTT 
GCTAACAAAG AAGCATTTAT TGATATTGGA GGCATGCATG CTCGTGCCAA AGTTGAAAAA 
GGTGTGAAAT GGATTACTGA TAAAGCTGCT GTTGAAGGCG ATGAAGCTAA AGaATATIGG 
TTGTGTTGGG TAACAACAGA ACGTAATGAA CAAGGACCAT ATTACGCTGG TTTAACAGCG 
TGCTATTTAT TAGTGAATAA AGCAATTCGT CGTGGTTATA AAAGTATGCC TGAACATGTT 
AATATGATGG ATAAATCAAT GAAACATCAT ATTATCATAG ATCAAATTGG TGACGAGAAT 
AAAGCTATTT TAAAAGACTT TTTAATGAAC CATGATGAAG GTATGTGGAA GCATTCTTCT 
GATGCTTTAC ATCAAGCATT TAATTAAATA TTAGAAACTA AAATTTCCCA ATTAATCTAT 
AAAGATATGA TTCATTTCTC AATGAC 
(2) INFORMATION FOR SEQ ID NO: 432: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2304- base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



60 
120 
ISO 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1466 
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* - 

(xi) SSQUENCE DESCRIPTION: SEQ ID NO: 432: 

TTGTACGAAT ACAAAGTTGC ATTAATATAG AATCATTTAT GCTTTTTAAT ATCACAAAAC €0 

^ AAATTGATTA AACTAGCTAA AATAGTCAAA ATTGGAATCA AGATTACATA AATATCATAA 120 

CCTCTAGATA TTAGTATACA TAATATAATT AGCGACCCTA TTATAATTGC TAAATTATAA 180 

GCCAAACTAA TTTTATATTT CATTTCAATT CCCACCTTAA TAGCATTTAT TAAAATTCTA 240 

10 

TAATGTTTAC ATAGACTTCT TAACAAACTT TAACCCAGCT AAGCTAAGTA TTGAAATAAT 300 

TACACCTCCT AATATAAATA TATTACTTAA GCTTAGTAAA GGTATAATTA TACTTATCAG 360 

.J TCCTAAAGAC AATGTATCCG CTGcATAATT CGaTGtAGAT GAGATACTAA' ATACTTTCCC 420 

15 

CATCAAATGA TTTGGCGTTT TTATTTGAAT GGCAACTGAT CTTGTTAGTC CCTCTATAGA 480 



rTGTCCAAGT CCCAATAATG 


TTGCACCTAT 


ATATAATATC 


GCCACACTTG GAAACACATT 


540 




r 


\ATAATCGAT AAGCCAATTC CCCAAACTAA AACACCAATA 


CTAAATTT AA AGATTAATCG 


600 


20 


i 


rTTTTCTGAC AGCAAACCCA 


TAATCAATGA 


CATTAATAAA 


GATGCTATAC CTAAACATGA 


660 




( 


rGTAGCTAGT CCATATACAC 


CAACGCCCTC 


TTTTAATATA 


TTGGAAATAA ACAATGGTAA 


720 


Zo 


r 

• 


FACAACACGC CAAAGGCCAG 


TATTAATCAA 


TATGCAGGCA 


AATTGGATGA TTATAATAAA 


7B0 


• 


rGGAATTTCT TTAGATTGTT 


TCAAGAATTC 


CCAAGTTTCA 


GAAAAATCTT CTTTTGAGTG 


840 




f 


rCTATCAATC ATGTTGTTAT 


TTGTATATTT 


TAAAAGTGCA 


TTAAAAATAA ATCCTAAAAA 


900 




t 


rAGCAATATA CTACAAATAA AAAAGACGCC 


AACATTACCA 


ACTAGTATTA CAATGACACC 


960 


* 


9 


AATTAAAGCA GGTAAAATAA TATTTGAGCC 


TCTTTGCAAA 


CTATCGATTA ACGCATTACT 


1020 




m 
i 


rCTTGCTAAA TGCTCCTCAT 


CAATAATTTC 


AGGAAGAATT 


GCCCTAAACG CAGGATCCGT 


1080 


35 


1 


ATAGCAGTTA ATAATGGTGA TAGCTGTAGA TATGGTTAGA AGCGTCAGAT AATTTAAATT 


1140 




• 

i 


rGATGTTATT GCAAGTAAAG 


GAATAATTAT 


TATAATCAAA 


CTTAGTATAA GATCAGATAG 


1200 




f 


ATAAAGTATT TTCTTTTTAT 


TATGTTTATC 


AGAATATGCG 


CCACCGAAAA TACCAAATAT 


1260 


40 


j 


AATAAATGGA AGTGTTTGAC 


TCATAACCAT 


CATTGATAAT 


TTTAAAGATG ATTGGTTTGT 


1320 




i 


CAATTCAACA GTAAACCAAA 


TTATTTGTAA 


CGAAAACAGC 


ACAAAACAAC TCCGACGTAA 


1380 


45 


< 


SArATTACCA ATCAATAAAT 


ATGTAAAGTT 


TCTATTTTTC 


AAAACTTCTA AATACAACAT 


1440 




ATTTATCACC TCTCATAAAA 


ATAATTGAAT 


GCATCCACCA 


GCTTTTTTAG ACCTTCTTGT 


1500 




* 


AAACTCTCTT TATCCAAAGC 


GCAATTAATT 


CTAATATAAT 


TTAGTCAGTT AAATATCAAT 


1560 


SO 


1 


TATTTCGAAA TATACATACT 


ACTTGAAACA 


CCATACATAA 


CCCCCAAAAT GACTACTCAG 


1620 




1 


AGGTTATATT CTACTAATTA 


TGATTATATT 


AAATATGAAA 


ATATTATCAA AAAAATCAAA 


1680 




1 
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TCATTCTCAT CATATTCTAG GTTGTTTTTA ACAAACTAAA TATAGTGAAT GGAAATCAAC 1800 

TATTATTTAA ATTATGAATT ATTTTAATTC TTTCTTCTAC GAGCCAATAA CATTAATCCA 1860 

GCAATTCCAA TTATACTACT AAAGATCAAA CCTTTTTGCG TGCTTTCTAA ACCTGTTXTT 1920 

GGTAATTCTG CTCGTTTTTT CTCTTGATTA GCTACTGATT CTTTAGCAAT TTTAGATTTT 1980 

■ 

TTAACTTTAT CATTTTTATC CATTGAATGA ACTGGGCCAT TTGGTTTTGC TCTGTCTTTC 2040 

GATAATCCTG GATTGTTAGG ATTTACTGGG CCACTTGGAT GAGTTGGTCT GCTCGGCTTC 2100 

TCTGGGTTTT CAGGTCCTTT TGGATCTTTT GGTTTCTCTC CACCGAACTC TACAATCTTA 2160 

TCTACTGGTT GTTTtGTGAT CTCTTCTGTT GGTTGACCCT CTCCaUVCT^ TTCACCTGTT 2220 

AATGGGkTCA CTGTGAwTGG TGkTGTGAwT GTCyTACTTC CTGGkTGTCC TTCTTGTTTC 2280 

ACTCGCTCTT CACCAGGTTG TAAT 2304 
20 (2) INFORMATION FOR SEQ ID NO: 433: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4733 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDBDNESS: double 

(D) TOPOLOGY: linear 



IS 



30 



35 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 433: 

GTCTTAATAT TTTACAAGAT ACAGCCTGAC AATATTTATA TTACAAACCA ATATGGTAAA . 60 

GAGGCTGTGT CTCGATTAAA AAGAATTTTA GAGCAAAGTA TACCTAATAA AGAATATATT 120 

GATTTATCAG AGATATCATT AATTACATTT TTTAAACCAG AATATAATAA ACAACATGTG 180 

AATGAGGAGT TTAATTCTTT ATCTTCTTCG AAAATAAAGA ATTTAGCCAA AGAAAATGAT 240 

' *- 

GGTATTATTA TTTATTTAAA TTTTAAGGAT GTTAATTATC AACTGaTAaG TGAAGGCAAT 300 

40 ACTTTTTTTT CTGCAAAACC ATATTTGCAT TGTGTGTTCA ATAAAGATAT TTTAAATATG 360 

6ATAAAGTTG ATATAGAAAA TTTTTTCAAA , AGTATAGAAG TCAAATACAG TAAATAAGAT 420 

CAATTATTGA ATCCACCGAC CAGCAGATTT TTTTAAAAAA TTAATACCCC GTTAATACCC 480 

TTTGCTTCAA TTTGATGAAA ATCAATGAAA. .TTCAAAATTG AAGAAATCCT TTAATATCAA 540 

GGTGTACGAC AGTCTATATA ATCATGCGAA ATTCTAAAAT TTTCtGAcGT AAAAAAACAA 600 

ATTCyTAAAG CAGCTCGTCG TTCACCTCAA TTCTCAAAAC GTTAATTGTC GGACGATATA 660 

TATACAAAAC ACCTCGATGT TATGTCGAOG TGTTTTTTTG CGTTTGTGTG GGGAATATGG 720 

AATAGAGTAT AAATGAATTA ATGTCTCAGG TATAGAATTA ATTCAACTAT GAATTATTGA 780 
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TTAGCTTGCG GAGACCGTAC GATAGTGTTC TAATAATAGA TATTCAAGGG AAAGAGCTAT 900 

CGGATGATAA CCAGATGATA ACTCAAGAAC CATGrTTTAA GAGTGTTATC AAAATAAGGA 960 

GTGACTTAAT TGAAAGATTC TATATTTTGG AAGAAAGCTT TTATTyCTGT TTATTTTATT 1020 

♦ * 

GTTGsGATGC TGGTGTTTCT ACTTTTTAGG TTTTATATTA AaACAGATAA CTTTTCTATA 1080 

TATTTAATGA GTATCTTCTT AATTTGTTTA GGAACTGCTT CTATCATTTA TAACTATAAA 1140 

ACCAATCGAX AAATATAAGT ATGAAATGTA TAAGTCACAG TTAGATCTAA' GTCTTGCTGT 1200 

GGCTTTTTAT ATCTCCATAA AACGACAAAT TCAAGCCCGA CATAAAACAG CATTTTCAGC 1260 

CCACCATAAA ACGACAATTT CAGCCCGCCA TTGACTAAAC ACCACATCCC AAAAATATCG 1320 

TAACAATCCT CTACATCAAT CAATCCAACA TCCCTCATAA TCACAACGCA CAAAATCTAT 1380 

TCATGCATTT TTGGAATACT TAGTATTACA AATAACGATT TTTATTCATC TAACAAAGGT 1440 

20 TATATAATGT ACTGAAGGCA ATTTTTATGT ATTACAAATC TAATCGTACA TGTAAAATTT 1500 

TGATAAACAT CATTAATTTT GCGTAACTAT CATTAGATTA CAAATCACAA AGTAATTACA 1560 

. TGTAATACAC ATCTATACAT CACATTTGAA GGGAAATGaA TATAAATGAC TGATAAAAAG 1620 

TACACTGCAG CCOAXATGGT TATTBATACT TTGAAAAATA ATGGGGTAGA ATATGTTTTT 1680 

GGTATTCCGG GTGCAAAGAT TGACTATCTA TTTAATGCTT TAATTGATGA TGGTCCTGAA 1740 

CTTATTGTCA CTCGTCATGA ACAAAACGCC GCAATGATGG CGCAAGGTAT TGGAAGATTA. 1800 
ACAGGCAAAC CGGGTGTAGT ACTTGTTACA AGTGGTCCTG GTGTAAGTAA TTTAACTACT ' 1860 

GGATTATTAA CCGCAACATC TGAAGGGGAT CCTGTATTAG CGTTAGGTGG CCAAGTGAAa 1920 

CGnAnATGAT TTATTACGAT TAACGCATCA AAGTATTGAT AATGCTGCGC TATTAAAATA 1980 

TTCATCAAAA TATAGTGAAG AAGTACAAGA TCCTGAATCA TTATCAGAAG TTATGACAAA 2040 

TGCAATTCGA ATTGCTACTT CAGGAAAAAA TGGCGCAAGT TTTATTAGTA TTCCGCAAGA 2100 

40 CGTTATTTCT TCACCAGTTG AATCTAAAGC TATATCACTT TGCCAAAAAA CAAATTTAGG 2160 

AGTACCGAGT GAACAAGATA TTAATGATGT CATTGAAGCG ATTAAAAATG . CATCATTTCC 2220 

TGTTTTATTA GCTGGTATGA GAAGTTCAAG TGCAGAAGAA ACAAATGCCA TTCGCAAATT 2280 

AGTTGAGCGC ACGAATTTAC CAGTTGTAGA AACATTCCAA GGTGCAGGTG TAATTAGTCG 2340 

TGAATTAGAA AATCATTTCT TCGGTCGTGT GGGCTTATTC CGCAATCAAG TTGGTGATGA 2400 

ATTATTACGT AAAAGTGATT TAGTTGTTAC AATCGGTTAT GATCCAATTG AATACGAAGC 2460 

TAGTAACTGG AATAAAGAAT TAGAAACACA AATTATCAAT ATTGACGAGT TCAAGCTGAA 2520 

ATTACTAATT ATATGCAACC GAAAAAAGAG TTGATTGGTA ATATTGCTAA AACGATTGAA 2580 
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CAATTAAGAA CACATATTGA TGAAGAAACT 
CTACATCCAG TGGAAATTAT TGAATCTATG 
^ ACAGTTGATG TTGGAAGTCA CTATATTTGG 

AGACATTTAT TATTTAGCAA TGGTATGCAA 
TCAGCTGCAC TTGTGCGCCC TAATACGCAA 

TO 

TTATTTTCAT CACAAGATTT AGAAACGG.CC 
ATTTGGAATG ATGGAAAATA TAACATGGTT 
TCGTCAGGTG TAGACTTCGG TCCTGTAGAT 

IS 

AAAGGTTTAC GAGTTACTAA TCAAGAAGAA 
ACAGATGGTC CAGTATTAAT TGATATACCT 
20 ACAAATATGT TACCTGACGT ATTTAACTAA 
GATTTTATGA CTAATGTTTT ATACCAACAT 
TTAAAAGGAA CTGCATCAAT AAATGAATTA 
CTAACAGGTT CAAACGGTGA GGTAATCTTT 
CATAAAGAAT TTGTAGAATT AAAAGGTGAC 
TTTGTAGCAG ATACAAGCTA TGAAACGAAA 

30 

ATTAAGGAAA AGATGTTGAG TGAAAATTTA 
AAAAAAATGC ATGTACGTAT GATGCCGGCT 
35 TCAGCTAGAA GACAACCTGA ACAAACTGAA 

TTTACACCAG AATTATTCCA TGGTATCGGA 
GATGATCGTA ACTTTGGTGG ACATGTCTTA 
ATCCAAAATA TAGAAACATT TGAACAGCAT 
. GCAAATATTG ACTATAAAGA TATTGCAGAC 
AAATATAATG ACX^GTTTATG AAAATTGACT 

45 

' GTAAATATGA TTAACCATGA CTACAATAGA 
TAAAATAAAT CCCTTCACTA TTAGCAGTAG 
AGATTTGCTG TTATGTTTAG ATTATAAATT 
GTATAGGCCA ATCTGTTACT ACGAGAAGCA 
AAAAGACAAA CGCCAATTTT TCAGCGCTTG 

55 



GGTATTAAAG CGACGCATGA AGAAGGAATT 2700 

CAAAAGGTAT TAACTGATGA TACTACTGTA 2760 

ATGGCACGTA ATTTCAGAAG TTACAATCCA 2820 

ACGCTTGGTG TAGCATTACC GTGGGCAATT 2880 

GTTGTGTCCG TTGCTGGCGA TGGTGGCTTT 2940 

GTACGTAAAA ATTTAAATAT CATCCAGCTT 3000 

GAATTCCAAG AAGAAATGAA ATATAAACGT 3060 

TTTGTAAAAT ATGCAGAATC AtTTGGCGCG 3120 

TTAGAAGCGG CAATTAAAGA GGGCTATGAA 3180 

GTAAATTACA AAGATAATAT CAAACTTTCA 3240 

AATAAAGATA AATGTTAAAG AGGAGTGGGA 3300 

GGTACATTAG GCACATTAAT GGCAGGATTA 3360 

TTGCAACATG GTGACTTAGG TATCGCTACA 3420 

TTAGATGGAA AAGCTTACCA TGCAAATGAA 3480 

GAGTTAACAC CATATGCAAC TGTAACTAAA 3540 

GATAAATCTT CAGAAGCAGT TTTTGCAGAA 3600 

TTTTCAGCAG TAAAAATTTC 'AGGCTTATTT 3660 

CAAGAACCAC CTTATACACG TTTAATCGAT 3720 

ACGTATGTCA AAGGTTCAGT CGTTGGTTTC 3780 

TCAGCAGGAT TTCATGTAGA CTTTGCGAAT 3840 

GATTTTGAAG TAGAAGATGT TAAAGTAGAA 3900 

TTTCCAATTC AAGATAAAGA TTTCACTAAA 3960 

GAAATTAGAG AAGCTGAATA ATGAATCCAG 4020 

TCATAATGCG CGATTTAGAA ATGATAGTTT 4080 

ACAAATATAT TTATAATTAC GTCTAAGTAA 4140 

TGAGGGGATT TATTAGGTTC CAGATATTTG 4200 

GTGGTACACA CTCATATAAA ATTTACTATT 4260 

AACAACAATA ATTTACAAGT TCAATAACTA 4320 

CCCTATAAAA CTATTTTCAA ATTATTATTT 4380 
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TTTCTTTAGA TTCACTACTT TTTTATTACC ATCATTCAAA GTAAGCGTAT AAGTTGCTGT 
TTGGGCATTA TTAATTTTTT CTGTTGTAAC ACCACGTTGA GAAGCTAATT CATTTTTTAC 
TTTACTGTCA ATTTCTTGAT AAAGAACATT TTTATTTTCT GGGAAGATAA AGTAAGTTCG 
ATGTAATGCA GTAATACCAT CTACTGAAAT TGTGTAAGGA ACAGTGTGAT AACCATCCAC 
AGTCATTTCT TTATAGCCGT TATTACTATC TGCAGATGCT TCGTGACTCG GTA 
(2) INFORMATION FOR SEQ ID NO: 434: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1284 base pairs ... 

(B) TYPE: nucleic acid 
IC) STRANDEXINESS : double 
(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 434: 



AATAAATGGT 


AATTTTATAT 


CATCAACGGC 


TACAAATGGG 


GCAGTTTCAT 


ATATAAATAA 


ACACATCTAC 


TCAACTGnTC 


TTAATTAATT 


AATAAATGAT 


TTACCAGATG 


ACATATAACA 


GCCATTATTA 


GnTTAATTCT 


AATAGTTTAT 


TTAAAITTTC 


TTCGGTTGTC 


GCCCAACTGG 


TTGCGAATCT 


AACAACACGA 


TGTTGATCAT 


CGTATTTTTC 


CCAAACAGCA 


AATTTAACTT 


TTTGTTCTAA 


CTCTGCTATT 


TTCTCGTTAC 


TTAAAATAAA AAATTGTTGA 


TTGGTTGGAG 


AATCAAAGTA 


AAGACGATAG 


CCTTTATTTT 


TAAACCCGTC 


TTTCATCTTA 


TTTGCCATTT 


CGATAGCATG 


TCTGCTTATA 


TTAAAATATA AATTGTCCGT AAATAATTCT 


AAAAATTGTA 


TGCCTGTTAA 


CCGTCCTTTT 


GCTAAAAGGG 


CACCGTGGAT 


GCTTGATTCG 


AGTGGTAAAT 


TGTTTCGGTT 


CATTATTTTT 


CGTAAAAACA ATGGCTTCCC 

• 


CGCATAATGC 


ACCTATCTkC 


GTACCACCTA 


TATAAAATAC 


ATCACAATAT 


TTAGCGrTGt 


CTTTAATAGT 


CATATCTGAT 


TGGTCACTCA 


TCAATCCATA 


CCCTAATCGT 


GCACCATCCA 


TAAATAATGG 


AAGCTGATAT 


TGCTTACATA 


CTTTGCATAA 


CTCTTCCAAT 


TCTGaTTTAG 


AGTATAATGT 


GCCATATTCT 


6TAGGATGAG 


AAATATATAC 


CATTCCTGGG 


AATACCATAT 


GGTCCTTTTT 


AAAATCACTT 


TTAAATGTCT 


CCATGTAAGT 


TTCAACATCT 


GAAGCACTAA 


CTTTTCCTTC 


CTTAGAGGGT 


ATAGTAATTA 


CTTTATGTCC 


ACTATATTCA ATTGCACCGC 


CCTCATGCAC 


AGCAACATGA 


CCAGTGTCTG 


CTGAAATGAC 


CCCTTCGTAA 


CTTTCTAACA TTGAATTAAT 


AACAACCTGA 


TTGGTTTGTG 


TTCCACCTaC 


TAAAAAACGA 


ATTGTAGCAT 


TTGGaCAGTC 


AATTGTATCT 


TTAATCTTTT 


CAATTGCCTG 


AGCTGTGAAT 


TGaTCAAAGC 


CATATCCCGA 


AGCTTGTACA 
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TCGAATGAAA TCACTACATT TCCCCCTAAA ACTAATATCA ACATTTTAAT AAGATAAACC 
AATTTCAAAA CTAGTTCGAT ATTTAAAATG TATTATGGAT GGnTAAAGTT TGTATCGCAT 
TATCGCGAAG TTGliATAAAT ATAT 
(2) INFORMATION FOR SEQ ID NO: 435: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1072 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 435: 



ACAGCTTTTG 


GTAArGGAGA 


AAwTCAaTAt 


GAAACAGTAT 


AArGCGTATT 


TaATCGATTT 


AGATGGCACA 


ATGTATATGG 


GAACAGATGA 


GATTGATGGA 


GCAAnACAAT 


TCATCGATTA 


TTTAAATGTA 


AAAGGCATTC 


CTCATTTATA 


CGTAACTAAT 


AATTCAACAA 


AAACACCTGA 


GCAAGTAACT 


GAAAAATTAC 


GTGAAATGCA 


CATTGATGCT 


AAACCAGAAG 


AGGTTGTAAC 


GTCAGCGTTA 


GCCACTGCTG 


ATTATATTTC 


AGAACAATCA 


CCAGGAGCAT 


CAGTATATAT 


GTTAGGTGGG 


AGTGGTTTAA 


ATACTGCGTT 


AACCGAAGCG 


GGACTTGTCA 


TTAAAAATGA 


CGAGCATGTT 


GATTATGTAG 


TTATTGGACT 


TGACGAACAA 


GTTACATATG 


AAAAGCTTGC 


GATT6CAACG 


TTAGGTGTAA 


GAAATGGtGC 


AACATTTATT 


TCTACAAATC 


CTGATGTATC 


AATTCCTAAA 


GAGCGTGGTT 


TATTACCTGG 


TAATGGTGCT 


ATTACAAGTG 


TTGTAAGTGT 


ATCGACAGGT 


GTATCGCCAC 


AATTTATTGG 


TAAACCAGAA 


CCGATTATTA 


TGGTTAAAGC 


ATTAGAAATT 


TTAGGATTAG 


ATAAATCCGA 


AGTTGCTATG 


GTAGGCGATT 


TGTACGATAC 


CGATATTATG 


TCTGGTATTA 


ACGTAGGTAT 


GGATACGATT 


CATGTACAAA 


CAGGTGTATC 


TACGTTAGAA 


GATGTGCAAA 


ATAAAAATGT 


GCCACCAACG 


TATTCTTTTA AAGATTTAAA 


TGAAGCAATA 


GCTGAATTAG 


AAAAATAGAT 


ATAGTCATTT 


TATAAAGTAG 


GTGAATTGAT 


TTGGTAAAAA 


TAGTTGTTTC 


GAGGAAAATT 


CCAGATAAAT 


TTTATCAACA 


ATTAAGTAAA 


CTTGGTGACG 


TTGTTATGTG 


GCAAAAATCA 


TTAGTGCCTA 


TGCCTAAAGA 


TCAATTTGTG 


ACaGCcTTCG 


TGACGCAGAT 


GCTTGTTTTA 


TTACATTAAG 


TGAACAGATC 


GATGCAGAAA 


TTTTAGCGCA 


ATCACCAAAT 


TTAAAAgTAA 


TTGCGAATAT 


GGCTGTAGGA 


TA 



(2) INFORMATION FOR SEQ ID NO: 436: 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3271 base pairs 
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75 



20 



25 



35 



40 



(C) STRANDEDNESS : double 
CD) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 436: 

TAAAAACTTA CTTTAACACC ATTCCTTTTT AACTTTTTTC GTGTTTCnTT TnCTTAAGTC 60 

10 CATCCATATT TTTAATGATG TCATCTGCTG TTTTATCTTT TAAATCTAAC ACTGaGTGAT 120 

AmCGAATTTG TAGCACAGGA TCAAATCCTT TATGGAATCC AGTATGTTCA AATCCTAAGT 180 

TACTCATTTT ATCAAAGAAC CAATCATTAC CAGCATTACC TGTAATCTCG CCATCATGAT 240 

TCAAGTATTG ATATGGTAAA TATGGATCGA TATGTAGGTA TAGACAACGA TGTTTTTTAA 300 

CATATTTTGA TAATTCATTA AAGAAAAAGT GTACGAGTTC TTGATTTTCA TAATCAATCA 360 

CTGGACCGCG ATTTGAATAA AAATACTTGA ACACTTTCAT AACAGGTACA GCAGTAAGtA 420 

AGCAAGCTGC AATGACCTCG TTATTATTGT TTTTTATTCC CACTAAATGT GTTTCATAAC 480 

CTTCAGCAAG CTTTAACTCA TAGTGGCCAA CAGTTTGCGT GaAATGACTG TATGGCATGC 540 

TATCTGTAAa GGCACCAAAC TCTTTAGCTG TTAAATTTGT AAACTTCATT ATCATTACTC 600 

CTATTTGTCT CTCGTTAATT AATTTCATTT CCGTATTTGc AGTTTTTCTA TTTCCCCTCT 660 

GCAAATGgCA AAAATAATAA ATCTAATCTA AATAACTATA CAATAGTTAA TGTTAAAACT 720 

30 AAAACATAAA CGCTTTAATT GCGTATACTT TTATAGTAAT ATTTAGATTT TTGAATACAA 780 

TTTCAAAAAA AGTi\ATATGA ACGTTTGGGT TTGCTCATAT TACTTTTTTT GAAATTGTAT 840 

TCAATTTTAT AATTCACCGT TTTTCACTTT TTCAAACAGT ATTCGCCTAA TTTTTTTAAA 900 

TCAAGTAAAC TTAATTATTC AATGTTTGTT GGATAGATTG TAAATATTTA ATGATTTCCT 960 

CACGCGTGTT AGATTTAAAT CGCTTAACGA TTTCGCTACC AATGACAATG CCATCTGCAA 1020 

CCTCTTTTAT ATCTGCAACA TGTTGTGGTG TTCTTATACC AAAXCCTGCG ACAACTGGCA 1080 

CATTGGCTAT CGCTTTAATT GACTCAATTT TTCGTTTTAA TTCTGGATGA AACGCACCGT 1140 

TTTGCCCTGT TGTCGCATTC ATCGTCACAG TATAAATAAA GCCTTCCGCA TGGGATACGA 1200 

45 TATCTTTTAT ACGTTTGTCA TCAGTAGTCA TCGCAACTAA CGATATGATT TTGACGCCAT 1260 

AGTGACTAAA TTGTTGTTTT AAACGCTGCG ATAATTCATA TGGTAAATCA GGAATAATTA 1320 

AGCCGTAGAC ACCAGTATCT CGACATTTTT CAAAAAACGC TTGTTCTCCA TAATGACAAA. 1380 

TAATATTATA ATACGTCATT AATACATAGT TACACTTAAT TTGATCACCA TGTTTTTCTA 1440 

ATTGATTGAA AATATAATCT ATCGTGATGC CTTGTTTAAT CGCTTGTTGA CCTGCTTCCA 1500 

TGATAACTGG ACCATCAGCA ACCGGATCAG AGAAAGGTAC TCCAATTTCA ATTATATCTG 1560 

55 



1339 



EP0 786 519 A2 



10 



IS 



20 



2S 



30 



3S 



40 



45 



SO 



GTATAAATAA TTTAGTCATT TGCAAGACCT CGCTCTACCA TATATTGTCT AATTGTTTCC 
ATATCTTTAT CGCCACGTCC AGAAATAGTT ACTACAATAA TATCTTCTTT CGACATCGTA 
GGCGCTAGTC TTTCAACATA ACTCAGTGCA TGTGCACTTT CAATTGCAGG TATAATACCT 
TCATGTTTTG TAAAGTTGAT TAAAGCATTC ATTGCTTGTG TATCACTAGC ATTTTCAAAA 
GTTACTCTAC CAATGTCGTG GTAATAAGAA TGTTCTGGTC CAATACCAGG ATAATCAAGT 
CCTGCTGAAA TAGAATGTGC TAGTTGCACT TGCCCATCTT CATCTTGAAT TAAATACATT 
TTAGTACCAT GTAATACGCC AGGTGATCCT TTGCCAATTG CAAGTGCATG TTTATCAGTA 
TCATCGCCTT GACCTGCGGC TTCAACACCG TATAATGCAA CATCATCTTT AATAAATGGA 
. TAAAATGTAC CGATTGCATT TGAGCCACCA CCGATACATG CTACAATTGC ATCCGGAAGT 
CGACCTTCTT TCTTCAATAT CTGTGATTTT ATTTCTTTAC CAATCACACT CTGAAAATCT 
CTAACAATCG TTGGGAACGG GTCTGGACCT AATGCAGAAC CTAATAAATA ATGTGTATCA 
TCTACATGAC TTACCCAATA TTGCAATGCT TTATTAACTG CATCCGATAA AGTCCCTTGA 
CCATCTTCAA CTGCCACAAC CTTTGCACCA AGTAATTCCA TTCTAAATAC ATTAAGTTGT 
TGTCTTTTAA TATCTTCACT TCCCATAAAG ACAACAAGTT CCATATCAAA TAATGCAGCA 
ACCGTAGCAC TAGCTACACC ATGTTGACCC GCACCAGTTT CAGCAACAAG CTTCTTCTTG 
CCCATTCTTT TAGCAAGCAA CGCTTGACCT AACGCATTAT TAATTTTATG GGCGCCTGTA 
TGATTTAGAT CCTCTCGTTT CAAATATATT TTAGCGCCAC CTAGGCTTTC AGTATATGAT 
GCAGCATATG TAAGTGGTGT CGCGCGTCCT ACATACTCTG ATAAATAGTA TTCCAGTTCT 
CTTTGAAACT CTGGGTCTGC TTTTGCCTCT TTATAAGCTT TTTTCAACTC AATAATTGCT 
GGCATTAATG TTTCTGGAAC ATATTGCCCT CCATATTCAC CAAAGAAACC TAATTCATCT 
GCTTCTGTTT GTATTTGTTT ATTCATTGTC TCTATCTCCT TTCACAATAT TTACAATTGC 
TGTCATTTTT TCTATATCTT TTCGCCCATT TACTTCTATA CCTGATGCAA GATCATAACC 
TTGATGTGAT AATTTAAGTT GATTAACTGT TTGAATATTT TCAGAGTTAA TGCCTCCTGC 
TATCAAATAA GGTATGTCTT TTATGTGCTT CAAAATAGTC CAGTCATATG TTTGACCGGT 
ACCACCATAC GACACTGAGG GTGTGTCGAT AATAiy^TAAA TCTACGAACC CTTTATATTT 
ATTTATGTTT TGGATTATGT TTTCATCTnG CAGtAAAGCT TTAGTGATTT TAATGCTTGA 
ATATkTCTTT TTAATTTCCT GTAtAAAAtC AATAGATTCt GcGTAACTGT ATTGTGJcTAA 
wTGaCGwATg CtTAAwACgT GTGCCAATGG T 
(2) INFORMATION FOR SEQ ID NO: 437: 



1€80 
1740 
1800 
1860 
1920 
1980 
2040 
2100 
2160 
2220 
2280 
2340 
2400 
2460 
2520 
2580 

* 

2640 
2700 
2760 
2B20 
2880 
2940 
3000 
3060 
3120 
3180 
3240 
3271 
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JA) LENGTH: 1S53 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 437: 
ATAATGAAAT AATACTGTGT TTTATCTGCG AAATGTAtCA TTTTCTAATc GTTTCACAGT 
AAAATGAAAA GATAAAGTGT GTTTTTACTT GAATTTTGAC TAAAATTACT CTATATTTAT 
TAATTGAGCT ATGCTTATTA TTACAATTTG ATTACAAATT TTAAATTTGT TAATTGAATG. 
ATAATATTAA ATAAAGAAAC TTACACAAGC AAATATGAGT TGTAGCCCAA AATACTTGTT 
AAATCAAAGT TGAAAGCTAC AAATAATGAA AATTATAAAC TTGAATCTGA AAGTAATTAC 
TATAATTATG ACAATGTTAA CTTTTAAACG CACTTATTAA TTAACTACAT AATGTTAATA 
TCTAATTTAT TCAAGTACTT TCGCAAGATT TATTATCTAA- ATAACGGGGG AAAGAATCAT 
GAGTtCACAA AAAAgAAAAT TAGTCTTTTT GCGTTCTTCT TATTAACCGT AATAACGATT 
ACCTTGAAGA CGTATTTTTC TTATTATGTT GATTTTTCTT TAGGTGTTAA AGGTTTAGTA 
CAAAACTTAA TATTATTGAT GAATCCTTAT AGTTTAGTAG CACTGGTTTT AAGTGTGTTC 
CTATTCTTTA AAGGCAAAAA AGCATTTTGG TTCATGTTCA TAGGCGGCTT CTTATTGACG 
TTCCTATTAT ATGCCAATGT TGTGTACTTT AGATTCTTCT CTGATTTTTT AACGTTTAGT 

• * * • ' * ■ 

ACTTTAAACC AAGTAGGTAA CGTAGAATCT ATGGGTGGTG CGGTTAGTGC ATCATTCAAA 
TGGTATGACT TTGTTTATTT CATTGATACG TTAGTTTACT TATTCATTTT AATATTTAAA 
ACAAAATGGT TAGACACAAA AGCATTTAOT AAOAAATTTG TTCCTGTCGT AATGGCGGCT 
TCAGTAGCAT TATTCTTCTT AAACTTAGCT TTTGCTGAAA CTGACAGACC AGAATTATTA 
ACACGTACAT TTGACCATAA ATATTTAGTG AAATATTTAG GACCTTATAA CTTTACAGTA 
TACGaTGGTG TTAAAACTAT CGAAAATAAT CAACAAAAAg CGCTAgCATC TGAAGATGAC 
TTAACaAAAG TATTAAAtTA TACGAAAcAA CGTCaAACmG AGCCTAACCC rGAwTATTAT 
GGGGTGGcAA rGAAGAAAAA TATTATTArG ATTCATTTAG AAAGTTTCCA AACCTTCTTA 
ATTAATAAAA A<3GTTAATGG TAAAGAAgTA ACACCGTTTT TAAACAAATT ATCAAGTGGG 
AAAGAGCAAT TCACATACTT CCCTAACTTT TtCCATCAAA CAGGTCAAGG TAAAACATCT 
GACTCTGAAT TTACAATGGA TAACAGTTTA. TACGGTTTAC CGCAAGgTTC TGCCTTTTCA 
TtaaaaGGAG ATAATACGTA TCAGTCATTA CCAGCAATTT TAGATCAAAA GCAAGGCTAC 
AAATCTGATG TCATGCACGG TGACTATAAA ACATTCTGGA ACAGAGACCA AGTATATAAA 
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(2) INFORMATION FOR SEQ ID NO: 438: 

Ci) SEQUENCE CHARACTERISTICS: 

<A) LENGTH: 1419 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNBSS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 438: 
ACAAAATCAA TCAGCAAAAT GATTGGATTA AGACGCAAAT TGAGCGTTCA ATGGAAGGCG 
AAACAGTTGG CATTAATGAT CAAAATATAG AAATATATAG TGAAcGtTgA GATTTATACC 
ATACACTCGT ACCTTTAAAT CAAGAATTGC. ATAAGTTGCG ACTTAAAACT CAAAACTTAA 
CCAATGAAAA TTATAATATT AATGATGTGA AAGTTAAAAA GATTATTGAA GATGAACGTC 
AAAGACTAGC ACGAGAACTT. CACGATTCTG TTAGTCAGCA ACTTTTTGCG GCmAGTATGA 
TGCTATCTGC TATCAAAGAA ACGAAtTAGA ACCACCATTA GACCAACAAA TTCCTATTTT 
AGAGAAAATG GTTCAAGATT CGCAGTTAGA AATGCGTGCT TTGCTGTTAC ATTTAAGACC 
3CTTGGTTTA AAAGACAAAT CTTTAGGTGA GGGTATTAAA GATTTAGTTA TTGATTTACA 
^AAAAAAGTG CCAATGAAAG TTGTGCATGA AATACAAGAT TTTAAAGTGC CTAAAGGTAT 
FGAAGATCAT TTGTTCAGAA TTACACAGGA AGCAATTTCG AATACATTGC GTCATTCAAA 
CGGTACAAAA GTGACAGTAG AATTGTTTAA TAAAGACGAT TATTTATTGT TGAGAATTCA 
^GATAATGGT AAAGGTTTTA ATGTT6ATGA AAAATTAGAA CAAAGTTATG GACTTAAAAA 
rATGCGTGAA AGAGCTTTGG AAATTGGTGC AACGTTCCAT ATTGTATCAT TGCCAGATTC 
\GGTACACGT ATCGAGGTGA AAGCACCTTT AAATAAGGAG GATTCGTATG ACGATTAAAG 
rATTGTTTGT GGATGATCAT GAAATGGTAC GTATAGGAAT TTCAAGTTAT CTATCAACGC 
\AAGTGATAT TGAAGTAGTT GGTGAAGGCG CTTCTGGTAA AGAAGCAATT GCCAAAGCCC 
^TGAGTTGAA GCCAGATTTA ATTTTAATGG ATTTACTTAT GGATGACATG GATGGTGTAG 
\AGCGACGAC TCAGATTAAA AAAGATTTAC CGCAAATTAA AGTATTAATG TTAACTAGTT 
rTATTGAAGA TAAAGAGGTA TATCGTGCAT TAGATGCAGG TGTC6ATAGT TACATTTTAA 
W^CAACAAG TGCAAAAGAT ATCGCCGATG CAGTTCGTAA AacTTCTAGA GGAGAATCTG 
ITTTTGAACC GGAAGTTTTA GTGAAAATGC GTAACCGTAT GAAAAAGCGC GCAGAGTTAT 
VTGAAATGCT TACAGAACGA GAAATGGAAA TATTATTATT GATTGCGAAA GGTTACTCAA 
VTCAAGAAAT TGCTAGTGCA TCGCATATTA CTATTAAAAC GGTTAAGACA CATGTGAGTA 
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(2) INFORMATION FOR SEQ ID NO:. 439: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 608 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



10 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 439: 





ATGThGGCQG 


ACGTAAAGGA 


CATGTTTATA 


CTGATGATCG 


AGCATTAGAT 


ATTOATATCG 


60 


15 


TTCCGCCTGC 


TCAAGCAGAT 


GGTAAAGCTA 


CTAACCCCGA 


ACAATTATTT 


GCAGCAGGTT 


120 




ATGCATCTTG 


CTTCAACGGT 


GCTTTCGACC 


TAATTTTAAA GCAAAACAAA GTGCGTGATG 


180 




CTCATCCAGA 


AGTAACACTA 


ACAGTGAGAC 


TAGAAGATGA 


TTCAGACTCA 


GAAAGTCCTA 


240 


20 


AATTAAGTGT 


TTCAATTGAT 


GCGACAATTA 


AAAATGTTAT 


ATCTCAAGAA 


GAAGCTGAAA 


300 




AATATTTACA 


AATGGCTCAT 


GAATTTTGTC 


CATATTCAAA 


AGCGACTCAA 


GGAAATATTA 


360 




ATGTCGATTT 


AAATGTAAAT 


GTTGTAGATT 


AGCATTAACT 


TAAAGAGATT 


ATTCAACGTT 


420 


25 


ATTAATAAAA 


TTCACATAAA 


ATTCAAATTt 


StCrAcCAAA AATTTTTGGT TGGyTATTTT 


480 




TTCTATTCGT 


GATTGAAATT 


TCTGGCAATA 


rrrAACTGAA 


AATGATTGTA 


CCTTAGTCAT 


540 




CATAAATGTG 


ACCGGTTCCA 


ATACTGGCTT 


GACTTCTTCG 


CATACCGTCT 


ACAAATAAAA 


600 


30 


GTCCAGTG 












608 



(2) INFORMATION FOR SEQ ID NO: 440: 

<i) SEQUENCE CHARACTSRISTICS : 
. (A) LENGTH: 682 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

40 

(XX) SEQUENCE DESCRIPTION: SEQ ID NO: 440: 
CCTTTCAAtT TCTCCCAAgA TTTACGCATG TCTGACCAAA TGTCAATACA ATACCTGAAT 60 
AATGATTTCT GGAGTAATTG CGAAAAATAT TTAAAAGTTG CTATAGATCA ATTTTCAAAT 120 
TATAGTATCT CATCTCAAGT TTCTAACTAT CATTTCACAG TATTACTTGG AQATCGCCAA 180 
AAACCACTTA TGTATCTAAA TAAAAATCGC GGTGGTGATG GTGGCATACC AGGTTATATT 240 

60 

ATGATTTATT TAGTGCCGAG TACAAGTACA ATTAATTCTA TGAAAAGCTT AATTGCACAT * 300 
GAAGTAAATC ATAATATGCG CTA7CAATAT ATTGATTGGG ATGGCGGAAG TTTGATTGAA 360 
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ATTGGACCGT GGGTAACAAA TACTAATTGA AGTCGTGATA ACGTAAAAAT TAAAAATACT 
ATTTATAATC ATTTACATTT AAAGCATATA TTTGAATCGA tGCCTTATCT CTATGGTGAT 
GATATTAATA AACTTCAAGG TAGGCCTATC GTTGGCTTAT CTCATGCTGC CGGGTATGCA 
TGTGGCTATC ACTTGGTAAA ATACTTTTTA CAAAAAACAA ACATACCTAT TGAAGTTGCT 
ACAACACTTC CAGCACAAAA AA 
{2) INFORMATION FOR SEQ ID NO: 441: 

(1) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2574 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear / . 

<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 441: 
ATCTTCTTTT AACATGACAA ATTGCAACAA AATATTAATG ACGCCAAAAG ACATTTTTTC 
ACGTTCAATT AATTCTTCAA CCATTGTCTT TTGCGATATA GTTGGTTCTG ATTCAGACCA 
AGAAGCTAAC ATATCAATTG GACTCGTTTG TTCAAGTAAC TCAAACCATT CATCACTTTG 
TGGCTTTGGA TTCACTTCTG AAGATTTGCC CGCCGAAGAT GATGTAGCAG GAGATTTCAC 
CTGTAATTTA GGCATTTGAT TTTCGTGTTC CATTAAGTAA TACGAGCGTG CTTGTTTACG 
CATTTCTTCA AAGGATAACT GTTGTCCACT TGTAATTGAA TTTAAAATAA CATGCTTCAT 
GCCATCTGCT GTTAAACCAT ATAAAGTCGC GAGTTGTGTA ATTAAACOCT TTGCATCTTT 
GGTAACAATG TCTTGACTAA TAAAATGTTT ACCTAACATT TGTCTCAACA TTTCAAAGTC 
AAAAGATTCA TTTGATAAAT CGATACCTTG GTACGGTTCA TTAATCGGaA TATCACTTGT 

♦ 

ATCGATATCT ATTTTTGTAG ACGGCACTTT AAAAACATCA GTAAATTGTC TTGTTACCTG 
TTTAAATTCA CTCAAATCAA TTTGTTGATA CTCAAAGTAT TTCTTCAACT CATGAAATCG 
ACGATGCTCG ACTTCACTAT ATAAAAAGAT TGACAACATT GGATCATTAA AAAATAAATG 
TGCTGAAGGG GtTGaATTAA TTGGTAAACA AATTGTGTTT CTTGTTCATC ATGTTTGACA 
AACGCCTTTA ACAATCCAAT C6CTTCAAGT AAGTCCATTT GTTGTCTAAA CTCTAGTAAA 
TTAATTTTAA GTTCATTCAT AAAAATATAA TGAGAAAGAA TCAATGTTTC ATTATGACTT 
TCTTTAACGA ATTGAGTCAT AAAATGATAT AAACCCACTG CTTGCGTTCC AATTAGCGGT 
GTATACAGTC GATTCAATAC CTCTAAATGA TTCGTATTTA AATCAAAGTG TTGCATAACT 
TTGAATTGAT CCTTTGGTCT TAAGCCGAAT TCGAAGGCTT GTCGTCCCaT TTAAGCnATC 
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AAATTCTTTA TAGACTGATG CAAATCTAAC ATATGAAACT TGATCAACAT GCATTAACAA 


1200 




GTTCATAACG TGTTCACCTA TATCTCGTGA AGACACTTCC GTATGACCTT 


CATCTCGTAA 


1260 


5 


TTGCCATTCA ACCTTGTTAG TTATGTCTTC AAGTTGTTGA 


TATCTAACTG 


GTCGTTTCTC 


1320 




ACAAGAACGC ACAAGTCCAT TAAGTATCTT TTCTCTTGAA AACTGCTCTC 


TTGTGCCATC 


1380 


• 

10 


TTTTTTCACA ACTATAAGCT GACTAACTTC GATATGTTCA AATGTAGTGA AACGTGTTCC 


1440 


ACAATTTTCA CATTCTCTTC GTCTTCGAAT GGCATTTAAT 


TCATCGGCAT GCCTTGAATC 


1500 




TACAACrri'A GATTGTGTAG AATTACATTT CGGGCATTTC ATTACATCAC CCTCTTTATT 


X560 


IS 


TTGATTATGC CTAATTATAC TATAAATCTA GAGATGAAAA AAGAATCCCT 


CAATTTAATT 


1620 




CATTTAACCA AATAATGAAA CAATAAAAAA CATTATATCG 


TTACTTATTA AGTAATTTGC 

• 


1660 




ATGACAATAT TATTGTATTA AAAATAAAAA ACCTAACTCC GAAGTCAGAG 


TTAGGCTATA 


1740 


20 


AATTAATTGT ATTAACTTGC ACTTACAGTT TCTTTTGATG TCAAAAGTGC 


TCCAATTTGC 


1800 




TCAGCAACAT CTACAACTCT ATTTGAATAA CCCCATTCAT TATCATACCA AGCAATAACT 


1860 




TTTACrrrAT tccctgacat gaccattgtt gattttgcat caataatagc tgaatttgga 


1920 


25 


TTAGTATTAA AATCAACAGA CACTAGTGGT TGATGTTCGA CTTCTATGAT ACCTTCTAAA 


1980 




CCTGCATTTT CAAAAGCTTG GTTTACTTCT TCTGCAGTTA 


CTTCTTTTTC 


TAAATCAACA 


2040 




ACTAAATCAA CGAGCGATAC ATTCTTTGTT GGTACACGTA 


ATGCCATGCC 


GTGTAATTTA 


2100 


30 


CCTTCTAATT CTGGTAATAC TTCTTTTAAA GCTTTCGCCG 


CACCAGTAGA 


AGTAGGAATA 


2160 




ATGCTTTCAT TACATGAACG TGCACGTCTT AAATCTTTAT 


GTGGATTATC 


AATATTTTTT 


2220 


35 


TGGTCATTTG TAATAGCGTG AACAGTAGTC ATTAAACCAT 


TAACTATTCC 


AAACTGATTA 


2280 


TTTAAAACTT TTGCAACTGG ACCAATGCAA TTAGTAGTAC 


ATGAAGCATT 


ACTAAAAATG 


2340 




TCAAATGCTT CTATATCTAA TTGGTTATCA TTTACGCCTT 


TAACTACCAT 


TTGAACATGT 


2400 


40 


CCACCTTTTG nAGGACCAGT TAACAAAAsT TTTtTGGCAC 


CTGCTTTAAT 


ATGTGCGATG 


2460 




GCTTTATCAC CATGaTTAAA TTTACcAGTT GCATCTATAG 


CAATATCGAT 


ATCTAATTCT 


2520 




TTCCATGGCA AGTTTTCAGG ATTGCGATCA GCAACCAATT 


TAAITITATG 


ATCT 




45 


(2) INFORMATION FOR SEQ ID NO: 442: 








SO 


• . ■ . • ■ . * 

(i) SEQUENCE CHARACTERISTICS: 

(a; LENGTH: 3326 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
(0) TOPOLOGY: linear 
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CAAGGTACCG GTTTAGGTTT 
ATAGATGTTA AAAGCGAATT 
GAATAAAATT GAATATAGTT 
AGCATGCGTT TTTTGATTGA 
GCGAATATCA ACTATTAAAT 
TATTTATTTG ATTATAAAAA 
GAGGTGTCAT ATGAAAAAAT 
ATGTTCCACG ATGGAAAATG 
AGAAGAAATG GAAGCTTCAA 
TGCGATTGAA TTTGCGAAGA 

TAAAGATAAC TTTGGACTAA 

- ■ » , ^ — ■■ 

AGAAGTTTAT GTGCATTGTG 
CAAAGATGCC ATCCATCAAA 
TATGATGGTG GGTACAGTGC 
TAACTTATAT AAATTCTTCA 
AGAGGCAATT AACAAGACAC 
CTCTTCTAGA AGTTTAAAAG 
TAAAGAATTT AAAGAAGGAA 
AGATGCTGTT GCTACACTTT 
TGATGTAATC GAACTAAGTG 
AATCACAATA CAAATAGGGA 
TCGTCCAATA GAATATGGGG 
CAGAATTAAG TAGTTACTGG 
ATGGAAAAAG GTTTAAACAA 
GTGCTGCTGA TATTAAAATA 
AGACAATAAT TTATCAAGGA 
CATCGGGGTT TGGAGATGAT 
GCACAGATTA TTTAAAGCAA 
ATGCAGATAG ATTATCAAAT 
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GTTCATTTGT AAAATGATTA 
AGGGAAAGGC ACAACATTTA 
ATTTCAGAAC GCATGTTATT 
TGTGGGGAAT TTTGTATGTG 
ATATTACT AA TTTATACAAA 
TAGGGTAAAA TATAGATATA 
TCATTGGATC AGTTTTAGCT 
AATCAAAAAA AGACACAAAA 
AATATGTAGG . CCAAGGCTTC 
AGG^TCGTAA AGAATTTGAA 
AAGTTAAAGC TACAAATGTT 
AAGATCATGG CATTGTATTT 
AAGGATCAAT GCGCAGTAAT 
TGAGTGGCTT TGAATATCGA 
AAGAAAATGA AAAGAAATAT 
AAAATGTCGG ATATAAAAAT 
AATATCGAAA GTATTATGAA 
TGGAACGAGC AAGAAAAGAA 
TTTCTACTAA GAAAAACTTT 
ATAAATTATA TAATTTAAAA 
AACCCACTAT TAATACTAAG 
TGCACAGTAA AGATGAATAA 
GTTTATCAAA ATATTGATAT 
GTAGACAGTT ATAATGATGA 
TATGAGTTAT TAGATGATAA 
ACATCTAATG AGGCAATTAA 
TGGCTCCAAA ATGCTAAATT 
ACAGATCAAT TATCAAATCA 
AGTGATTTTT TAAAAAAATA 



TCGAAGAGCA TGGTGGTTCC 
TTATTAAACT ACCAAAACCA 
GATTAGAGAC TCTAATTTAT 
GATTAGAACT TAGGGTTTTT 
AATATAAAGT TTGATAAAGT 
TTGTATTAAT TAAATTATTC 
ACGACATTAA TTTTAGGGGG 
ACAGAAACAA AATCTGTACC 
CAACCGCCTG CAGAAAAAAA 
AAAGTAGGTG AACAATTCTT 
GTAGGTAAAG ATGATGGTGT 
AATGCAAGTC TACCTTTGTA 
GACAATGGTg ATGATATGAG 
GCGCAAAAAG AAAAGTATGA 
CAATATACAG GCTTTACAAA 
GAATATTTTT ATATTACATA 
CCACTGATTC GAAAAAATGA 
GTGAATTACG CTGCAAATAC 
ACTAAAGACA ATACAGTAGA. 
AATAAACCAG ATAAATCTAC 
AAAGCCTTTT ATGATGATAA 
AATTAATGAT AGGGATTTAA 
AAAAAAAGAA TTTAAAGTTA 
TAAGAATAGT AATTTGAATG 
AAGTAAACCA ACTGGTCAAC 
TCCAAATAAT CCATTAAAAT 
AATGAATAAT GATAATGAAA 
ATATAAAATA AAGTTAGAAG 
TAGAATGGAA TCAAGTAACT 
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4 ♦ 



10 



IS 



20 



25 



30 



35 



40 



45 



SO 



ATCAAGGAGC GAAACATCCG AATGAAAAAG TTGTTGCTAC TGACTCAGCA ATGATTCCTT 
ATGCTGCTTG GCAGAAATTT GCTAGACCAC GCTTTGaTAA TATGATTAGT TTTAATAGTA 
CCAACGATTT ATTAACATGG TTACAAGATC CATTCaTCAA AGATATGCCA GGAAAACGCG 
TTAACATTAA TGATGGTGTG CCCAGGTTAG ATACTTTAAT AGACAGCCAT GTAGGTTATA 
AAAGGAAGTT AAATAGAAAA GATAACACAT ACGATACTGT ACCACTAATC AAAATAAAGT 
CGGTAAAAGA TACAGAAATT AAAAATGGAA AAAAAGTAAA AAAGACTATT AACATAACAT 
TAGATATGGA TGGGCGAATT CCAATAAATG TTTGGACAGG AGATTCGATT GCACGTTCTG 
GAAGAGGAAC TTTAATTAAA CTTAATTTAG AAAATCTTGA TGCGTTGAGT AAACTGATTA 
CTGGTGAAAC AAGTGGTATG TTAGCAGAAT GCGTAATCTT TTTAAATGAA AGTTTTAACA 
TCTCAGAAAA TGAAAATAAA AATTTTGCAG ATAGAAAGAa ACAATTATCA GAAGGATTTA 
AGGATAAGAT TAACTTATTT CAGTTAGAAG AAATGGAAAG AACTTTAATT AGTAAAATAA 
ACTCACTTGA AGAAGTTGCA GATGAAACAA TAGAAAGTAT TAGTGCTGTT AAACACTTAT 
TACCTGATTT TGCATTGGAT GCATTAAAAG AAAGAATTAA TGAGTTGTTT AAAGGTATAA 
AATCTTTTAT AGAAAAAGTG* TATGATAGTA TAGATAATGA AATTTTAGAA ATTTTCAAAA 
ATATAGATCA CGACTTCAGA GATGGAGTAT CTGAAGAAAT GATGAAACAT TTGAAAGTAG 
TGAAACAGAA TATAGACCAA ATAAAAAATC AAAATGATAT TTATGGTAGG CAAATTGCAG 
ATATTAQAAG TATTATGAAA CAACAAGATG. CAACAATTTT AGATGGAAAT TTTCAAATTA 
ATTGTAGCGG CGAAAATATG GTACAGGGTC TAGTTATACC TTCTAATTAT TTAGGAAGAA 
AAATGAAAAT ATTAAAAGAC CATATCGATG ATGGTATTAA AAAAATAGCA GACTATGTTC 
AAGGTATATA TGATGAATAT GCATCGAAAA TTGTCGATGT AATAAAATAT TTGATTAATA 
CAATTCCCAA AATACGTAAG AATTTAAGAC ATGCAATTGA AATGTTAAAT GTAAAAAAGA 
AAGAATTTTT GTCCCTGATT CCTAATGTAA CTTGTAATTA TATTAAAACT AAATTAGAAG 
AATTAGATAA TACTTTAGGC AAATGGGAGC CTTTTCTTAA TGATTTAAAA GCAGTGT.CAC 
CAATTTTAGA TAACCATTTA GATGATATTG TTAAGAACAT GAAGCCTTTG ATTGTACAAA 
TGAyATwTGA ACCATCACAT . TATGaCGATA TGTTTAATTC aAGAAAAGCT TTAACGcCAG 
TGTTCTCAAG CGTTTTATAA AGGTTG 
(2) INFORMATION FOR SEQ ID NO: 443: 

(i) SEQUENCE CHARACTERISTICS: * 

(A) LENGTH: 5301 base pal 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 



1860 
• 1920 
1980 
2040 
2100 
2160 
2220 
2280 
2340 
2400 
2460 
2520 
2580 
2640 
2700 
2760 
2820 
2880 
2940 
3000 
3060 
3120 
3180 
3240 
3300 
3326 
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10 



IS 



20 



(xi) SEQUSNCE DESCRIPTION: SEQ ID NO: 443: 

ACCTATAGCT C3GCCCGTCAA GTCCTGAATC ATATGTCGCT ATAAACCCAG TTGCATGCCC 60 

AGCAATCTCG GTTTCAATTT CAAAATCATG CTCTTTCAAA CGATCTATTA AAGTTCGAGA 120 

CGCAAATATT TCTTCATTAC CAAGTTCAGG ACGTTCATGA ATTCTATGAC TGATTTCGAT 180 

ATAACTATAT TTATrTGTTT CTATATAATC GAGAATTTGT TGTTTTTCAC TCATTTTTTA 240 

CTATCTCCCT TTTACCCTAC ACTCATTTTA ATCATCCACA ATATTTTGTT CTTTCAAAAT 300 

GAATTATTAC TTATTCTATC GGTTTTATCT CATGATGTCA* TCTAGTTTTT CTTTATTTAC 360 

AAAATTTTCT AATAACTAAA aGCCTTTCAT AAATTTATAA AACAGTTTCA AATTGTAAAA 420 

CATAAGCCCT ATTGTTACAA TTTAAGTATT GTTAGAAACA CAACTTACAA CAAACTTAAG 480 

TTTTATAATG CAACAAATCA TAAGCGTTTT ATAGTTTTGA GTAGTTAATA GGAGGAAATT 540 

CAAAATGACA AAAATGAATG TTGAAAGTTT cAATTTAGAT CaTAcTAAGG TGGTTGCCCC 600 

ATTTATTAGA TTAGCGGGAA CGATGGAAGG ATTAAACGGA GATGTCATTC ACAAATACGA 660 

2S CATTCGTTTC • AAACAACCAA ACAAAGAACA TATGGATATG cCCGGACTAC ATTCATTAGA 720 

ACATTTAATG GCTGAAAATA TTAGAAATCA TAGTGACAAA GTTGTTGATT TAAGTCCTAT 780 

GGGTTGCCAA ACTGGTrTCT ATGTATCATT TATTAATCAT GATAATTATG ATGATGTATT 840 

AAATATTGTT GAAGCAACTT TAAATGATGT GCTAAATGCT ACTGAAGTGC CTGCTTGTAA 900 

TGAAGTACAA TGTGGCTGGG CAGCAAGTCA TTCATTAGAA GGTGCTAAAA CTATCGCTCA 960 

AGCATTTCTA GACAAACGAA ACGAATGGCA TGATGTTTTC GGTACAGGAA AATAAATCTT 1020 

AGTCAATCAA GTTAATCAGA AAaGCAGTCG AACAATGATT TTACAATCGC CATTGTCCAA 1080 

CTGCTTTTTA TTATGCTTCA AAGTCAAAAA ATCGAACAAA TGAAAAAGTA AAATCTTTAA 1140 

CATTTGTCCG ATTTATTTGA GAACCACTAT AATTTCTTAA TTAGTCCCAT TAACACGAAC 1200 

TGCATAGGTA ACCTTAAATA TAGTTGCCAT GTTGGCAATT GTTTATCTCC TAAAGGTAAC 1260 

TTTTTAACTG CCATATAGAT ATTAGCTGGG AATACAGCTA GCAAGAATAG ATTGATTGTA 1320 

45 TTTTTCAAGC ATTGAGATGG TCTTTTAATT AAAAGTGCAA GTCCAAATAA TATCTCAAAG 1380 

ATTCCTGTAA CAAGAACCGC TGTTTTTCGA AGTGGCAAAC ATTTCGGTAT GATATTTCTA 144 0 

AATTGTCGTT CTCGTGTAAA ATGCAATACA CCTATTACAC TAAAACCTAT TCCTAATAAA 1500 

SO 

TATCTTAGTA TGTTCAATCA GCTTCAACTC CTATTCTGTA ATGATTTTAT GAATTAATGT 1560 

AGGCGATACA ACATGaTCAG CAATTGTTAT GCTTGAATCT AATTTTTTAA CAACATCGTC 1620 
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AAl T i " i" i"r rA TTTAAAACAA TACCAACCGC TAAATCAATA TCATCCTCTT TTGTTAAACG 
TCCCGCTCCT AACATCATCG AAGCGACACC TATATCGTTA GAGACTAATT CAGTCACATA 
ACCTGATTTT TTAGCTTTAT ATTCAATTTG ATATTGAGCT TGTGGCAAAC GCTCTGGATG 
GTCAATAACA GTTTCGTCGC CACCTTGGTT TTTAATAAAT GTTTTGAATT TTTCTAATGC 
TGCACCTGAA TTAATTGCCT CAATTAGCAA CGCTCTCGCT TCTTCAAGCG TTTCAGCTTT 
GTTTGCAAGT ACAACCATTT GAGAACCTAA TGTTAATACA AGTTCTGTTA AATCTTTCGG 
ACCTTGTCCT . TTCAACGTAT CAATTGCTTC TTGTAACTCA AGCGCATTGC CAATCGCACG 
TCCAAGTGGC TGATTCATAT CAGAAATAAT OGCCATCGTA TTACGTCCCA CATTATTACC 
AATACGTACC ATTGCGTGCG CTAATGCTTC AGCATCTTCT AATGTTTTCA TAAATGCACC 

• ■ 

GCTACCAGTT TTTACATCTA ATACAATTGC ATCTGCACCA GCAGCAATCT TTTTACTCAT 
AATTGAAGAG GCAATTAATG GTATTGAATT GACAGTACCA GTAACATCCC TTAAGGCATA 
TAATTTTTTG TCTGCAGGAG TTAAATTTCC TGATTGTCCT ACAACTGCCA CTTTATTTTC 
ATTAACCAAT TTCACAAATG TTGCTTCATC TATTTCAACA TGAAAACCAT CAATTGCTTC 
TAATTTATCA ATCGTACCAC CTGTATGACC TAATCCACGC ' CCACTCATTT TTGCAACAGG 
AACATCTACA GCTGCTACTA ATGGTGCTAA AACCAATGTA GTTGTATCTC CTACACCACC 
TGTTGAGTGC TTATCTACTT TGACACCTTT AATATCACTC AAATCTATCA TATCACCAGA 
ATTAACCATA GCCATCGTTA ATGCTGCACG . CTCATCATCA TTCATATCTT GGAAATAAAT 
CGCCATTGCT AAACTTGATG CTTGGTAATP AGGAATATCC CCTTTAACAT AGCCGCCAAT 
AAAGAAATTA ATTTCTTCCG TT6TTAGTGT ATGACCGTCA CGCTTTTTCT CAATAATGTC 
TATCATTCTC ATTTTTATCA TCCTTTTCTT AAAAAGCTTA GGACAAAGCA TCTGCGCTTT 
CTCTAGTCCA TT TTT A AAAG CACAAGCGAA AATTATTATA GCAAGCTATC GATTTCATTT 
TTAATATCAC AATTTCAATG CGATGTTATT ATTCTTAAAT AGATTGGTTA TAACGTTAAA 
GTCCCTATTA AATTATCTTA GAATCATCAT GGCATTTATG ATGTCTTAAA GCTGATATCG 
ACATACTTAT ATATGGTTAC GATGTCCCAT GCTTACATAT TTTTATAAAA TTAGTAATCT 
GAATCTGCTT CTAAACCTTG CATAATTTGa ACGCCTGCGC TCGCACCAAT ACGTGTCGCA 
CCTGCTTCAA CCATTTTATT GAAATCTTCT AAATTACGTA CGCCACCTGA TGCTTTTACT. 
TCTATATCAG CACCTACTGT ATCTTTCATT AATTTAACGT CTTCTGCAGT CGCACCGCCA 
CCTGCAAAAC CTGTTGAACJT TTTAACGAAG TCCGCACCAG CCGCTTTTGT TAATTCACTC 
GCTTTTACAA TTTCGTCATG GTCCAACAAT ACCGTCTCAA TAATCACTTT TACTGTGTGA 
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TTTAATGCGC CGATGTTGAT GACCATGTCA ATTTCATCTG CACCATTTTG AATCGCATCT 
TCTGTTTCAA ATGCTTTCGT CGCAGTTGTC GATGCACCTA ATGGGAATCC TATTACCGTA 
CAAACTAACA CCTCTG7UVTC AGCTAGTCGC TCTGCTGCAT ATTTAACATG CGTTGGATTC 
ACACATACAG ATTTAAAATG GTATGCTTTC GCTTCATCGA TGATTTGATC GATTTGCGTA 
CGTGTTGACT CAGGCTTCAA TAAAGTGTGA TCAATCAATT TTGCACTATT CATTTTCTAT 
CTCCTCCTTT ATGGTTGATT ATAAAAATAC GGTTGTAAAT TAGTTGATTG AGCGTCAGGT 
TCATTTAAAT ATCAGGTTAG ATGTTCGCTT TTTATGTAAC CX3CATACATA TACTATTACA 
TTAATTCATT TCCCATAAAC AAACAATACA ATTGAACGTG ATATCTTCAT TATGAACX3AT 
GACTTGACAA CAAGCTAATC AGGATTATAT TTTTATAATT CTTTAATTCT ATAGTACAAA 
AATTCGCAAA AAAGGGAAAC AAATGTTATC TTAAAATTAT TAATGAATAT TAAGGAGAAG 
ATAACAAATG ACAAAAGGTA CACCACATAT TCAACCAAAT GGAGTAAAAA TTGCTAAAAC 
AGTATTAATG CCTGGCGATC CGCTACGTGC AAAATATATT GCTGATAATT TTTTAGAAAA 
TGTTGAACAA TTTAACGATG TACGTAACAT GTTTGGTTAC ACTGGTACAT ATAAAGGTAA 
AGAAGTTTCT GTAATGGGTT CTGGTATGGG TATTCCAAGT ATTGGTATTT ACTCATATGA 
GTTATACAAC TTCTTTGATG TAGATACAAT CATTCGTATC GGTTCTTGTG GCGCATTACyV 
AGAAAATGTT AACTTATACG ATGTTATTAT TGCACAAGCT GCATCAACTA ATTCAAATTA 
TGTAGATCAA TACAATATTC CAGGTCATTT CGCGCCTATC GCTGACTTCG AGTTAGTAAC 
TAAAGCTAAA AATGTCGCTG ACCAAATCGG TGCTACTACA CACGTAGGTA ACGTATTATC 

* • * ' • 

TTCTGATACA TTTTACAATG CCGATCCAAC ATTCAATGAT GCTTGGAAAA AAATGGGTAT 
TTTAGGTATC GAAATGGAAT CAGCTGGTTT ATATTTAAAT GCGATTCATG CTGGTAAAAA 
AGCACTTGGT ATTTTCACAG TAAGTGATCA TATTTTACGT GACGAAGCTA CTACACCTGA 
AGAACGTCAA AATTCATTTA CACAAATGAT GGAAATCGCT TTAGAAATCG CAGAGTAACT 
TATTTAAATT GACTTTAATT GCTCTTTAAC AATGCGATTA AACTCAAAAA GCCAACACAT 
TCTGGGCGTA TCCCCATTTA TGTGTTGGCT TTTATTTATA TTATTACTTA TCTGTAGATT 
AGCTTAAGTA AGATTTAAAC ATCCAATTAT GTTTATCTAC TGATGTTTGC ATACCTATAA 
ACATATCTTC TGATACATCA TCGCCAGCAT TACCAGCAAT TTCGATTGCG TTTTCTAATT 
GXTTTGAGAT ATTTGTGAAG TCTTGTGATA ATTCTTCAAC CATTTGTTCT GCAGAGTAAC 
CTTTCGCAGC TTCTTTAACA ATTGATTGCT CTAAGCATTC AGTTAATGTA CCTACAGGGT 
TTCCTCCTAC CGCTAAAATT CTTTCAGCTA ATTCGTCTAC ATATTGGCTT GCTTCATTAT 
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AATTGTGTAG CTTTGTGTAA G 
(2) INFORMATION FOR SEQ ID NO: 444: 

^ (i) SEQUENCE CHARACTERISTICS: 

(A) liENGTK: 11466 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear" 

10 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 444: 



15 


GAAGATGAAA 


GCTATATTGA 


AGATGATGTT 


ACTAAAAAGG 


AAGCTATTTT 


AAGTATGCAA 


60 




ATTCCTAAAG 


GTTTCTCTCA 


AAAATTAAAA 


GAGAACCGTT 


TAAAAGAAAC 


GATACAGTTA . 


120 




TATGGTAGAG 


ATGACTTTAT 


AGGTGGTATT 


GCTGTAGAAA 


TTGTTAGTAG 


TTCATTATAT 


180 


20 


GAGCAGCAAA 


TTCCTAACAT 


TATTTATGAA 


CACCTTGAGG 


ATATGAAACA 


GCATCAATCC 


240 




ATCGATGCTA 


TCAACAAGTC 


CTATCATAAA 


CATACACCTG 


AATCTAAAAT 


CAAATTTGTG 


300 




TCGCTTACTA 


AACAAGCACA 


ACACTCTATT 


TCAATTAGCT 


TAATCTTTGC 


GGTGATTTTA 


360 


25 


TTTOrrAGCG 


CTGTTCAAGT 


AGTACTTCAT 


TATCGTTTAA 


ACCAACAAGC 


AGCATTGCAA 


420 




CGATTATCAC 


AATATCA'iTr 


AAGCCGTTTC 


AAACTATATA 


GTACTTATGT 


AATGACACAT 


480 


30 


ACGATTTTGT 


TATTGTTGGT 


ACTATTGGCA 


GTTAGTCTAT 


ATTTGTCTCA 


ACCACTCAGC 


540 


TTAATATTTT 


ACTTAAAATC 


ACTGTTACTT 


ATATTGATTT 


ATGAGATAGG 


TATCGTCTTT 


600 




ATCTTATTCC 


ATATTCAAAC 


AATAAGTCAT 


C6ATTATTCA 


TGACATTTAT 


ATATGCACTT 


660 


35 


GCTATGGGTA 


TCGTATACTT 


GATTATTTTC 


ATGTAAAGGA 


GCGTAACTGA 


TGATAGAAAT 


720 




TAATAACCTT 


TCAAAGCGTT 


ACCGTAACAA 


ACAGATTTTC 


AATCATTTAA 


CTATGTCCTT 


780 




TGATAGTAAT 


CGTTTAACCG 


TATTACTTGG 


TGATAATGGT 


* • 

GCTGGAAAAT 


CAACATTACT 


840 


40 


TCGTATGATT 


GCTGGTATTG 


AAAAAGCTAA 


TGATGGAACT 


ATCAACTATT 


TCGGCGAAAA 


900 




ATGGAATCAA 


AGACaAATAC 


aAAATCACAT 


CGGTTATGTG 


CCACAAGACA 


TTGCGTTATT 


960 




TGAACACATG 


ACAGTGGCTG 


AAAACATTAA 


ATTTTTTAAA 


TCACTTTGTA 


AAAATCCAAT 


1020 


45 


TAACGATACA 


ACTATCAACG 


AATATTTACA 


GCAATTAAAC 


TTTGATGATA 


CGTCTGCCAA . 


1080 




AGTATCTACA 


TTGTCCGGTG 


GGAATAAACG 


TAAAATTAAT 


ATATTAGTAG . 


.GTTTACTAGG 


1140 


SO 


TCAACCTCGA 


ATTCTCATTT 


TAGATGAACC 


GACAGTTGGT 


ATTGATTTAA 


AATCTAGACA 


1200 




TGACATCCAC 


CAACTACTTA 


ACATCATGAA 


ATCTAAATGT 


TTAATTATAT 


TAACTACCCA 


1260 




TCATTTAGAT 


GAAGTTGAAG 


CACTTGCAGA 


TGATATCAAG 


TTAATTGGCC 


AAGATCCTTT 


1320 
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CCCAAGCTGC GTATGATATC GCAACTTGGG ATTTTCTGTA TTATCTACTT TGCAAOTATG 
ACGTTGGGTC TACTGCATAT TGATTACCGA TGCCACCAGA CATACGTTGG AAGTGTACGT 
^ GAGGCGCTGT TGAATTACCC GTACTACCTG AATATGCAAT TTGGTCACCA GCTTTGACTT 
TATCACCAGC TGAAACAGTT AAACGATTAT TATGCATATA CCATTGGTAG TTATTACTGT 
TCGCTTCTTT AATCGTTACT TGATTGCCGC CACCATAGTT ACTCCAACCT GCTTGTACTA 

10 

CTGTACCATC AGTTAATGAG TAAACTGGTG AATTTTCAGG CATTGCATAG TCGACACCGT 



ATGCGCACC 


ACCACCGTGA TATTGTCCAT 


ATGGTTGTAG 


TTGTTTACGA CTTGTTAACC 


1800 


3CTTGCGTC 


TTTCGCATGA CCACTAGcTG 


TCQCTTTACT 


TGCTGATCCA 


CCATTTTGAT 


I860' 


AGATGTGCC ATTAGGATAA TTGACCTTTC 


CATTACCATC 


ATGGCTGTTA 


TACGCTTGGT 

• * 


.1920 


GTTGTTACT ATGTGAATAA TAGCTCGCGT CTGGACCTAC 


ATTTGATTGA 


TAACCATATT 


1930 


ATTAATATG 


CTGTTGGCTT. TGACTCGCTG 


TGTAGTCATT 


GTTATCrCCT 


GCTGTTGCTG 


2040 


ATTCACATA 


• 

TGTTTGGCCG CTTCCATTGG 


CATTTGCATT 


TTTTGGATAA 


CAGTTATAAA 


2100 


ATAATGCGT ATGTCCTTGA GCATCTACGA ATGTATAGCT ATATTCTTTA TTATCAAACA 


21S0 


TGCTTGATT 


CCAGTTACCA TCAGGTGTGT 


GATGATAATC 


CCCATTAGAA 


TCAATTGTAT 


2220 


ATAAGTACC 


ATAAGATACG TCTTGTGATT 


GTGTTGACAT 


TTGTGTATGT 


GCTTGTTGGG 


2280 


GTTTGTCGT 


TTCTGCTGCA TCTGCTTGAT 


GCGCCATTGT 


AAATGTAGCG 


AASCCATCGT 


2340 


GCAATCGCT 


GCTGCTGTTA ATTTTTTCAT 


GTATAAAACA 


TCCTCCATTA 


AAGTTAAAGT 


2400 


AGTTTTCAA 


TTAAACTGTA CTGCACATAC 


TAAAAGAATT 


AGACAACTGA 


GTAAAGGATT 


2460 


AATTCTCAT 


TTTCCAACTA TTTAATATTC 


CCGAAATGTT 


TTACTAAACT 


CATTACATTG 


2520 


CATTACAAA 


ATAGCCATAC ATTGATATTA 


AAATGACATC 


TCTCACTGCA TTCGTTTAAC 


2580 


TTTTATAAA 


TTTTCAAAAT TAACAACTAA 


TCGTTCGTCC ATGTTCGCGA 


rrCAACGCTA 


2640 


.TGCATGATA 


GTAATCATCC ATCAAATCAT 


ATCAACCAAA 


TTCCATTATC 


AATCGCTATT 


2700 


ATTGTCATT. CAACTTTCTA ATAGTGATAT GCTTCTCAGG 


CTTAAAAATC 


GTCATATCTT 


2760 


TCTATTAAT 


TAAATCATCT GTGAGCTTTA 


ATGCTACTAA 


TTCATTGCTG 


CCATAATACT 


2820 


'AATATATAA 


CGTTCTTGTA GTTAAATTTA 


TTACGGTCTG 


ATACATCGTA 


TAGTGATTGT 


2880 


AGCATCATG 


CGGACGTACA ATTCCAATCG GTATATTTAC 


CGCATCTAAT 


AAATAAAATG 


2940 


ATTCATTAA 


ATCCATTTCT TTATCATTGT 


TTTGAGCAAT 


GTTTGCTTTC 


ATAAATGCCA 


3000 


TCTCACAAA 


GCGCTCAGTT GAAGTAAATC »CCTGGCAA TCCAAATGTA CCTGCTTCAT 


3060 


X3CCTAAAGG 


TTCAATCGTT ACACCTTCCA ATAAATTTGC 


TGTTGCTGGA 


TAAGGAGAAA 


3120 
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CACCAATAGG ATTATCTTTT ATAACCACTT CACCCTCTTT AAATGAAACT TCGACTGTAT* 
GTCCAGTTGC ATCGGAAACA TGATAATGCA ATGGCGGAAC TTCACCGATG TCATTTAAAT 
ATACAGCTAC AACATGTATT TGGGATGCTT GTTGTTTCAT ATCTTCAATG CTTGTTGTAT 
ATCCCAAAAT CCATGTCACA ATTTCATTTT GCGTAATATT CATCGCGTCC GCTTTGTGTG 
TTGATCCATA TGAACTATAA CCTCGGAAAT ATTGTGTTGA AATGGCAACG CcATGTtCAT 
TAACACCATC ACCATAAATA AAACCTTCCA TATCTGTTCC TGTGCCAATA AAGCCATATT 
GCGTTTGGCC T6TCGTGCCA GT6CAAGATT TCCAACGATA ATTTCTAGGC GTCACTGCTG 
GCGAACCATC TAATGGATAA TCATAATCCA TCGTGCGTCC AAGAAGTACT TGATTATTTA 
AAGTTTGTAT TGTGAATCCT GTGCACATTG TTCTCACTCC TCTGTACCTT CATTTACTTT 
AATCACTTTC AAATAAAGCT GTTTCACTTA AACATACTAT AAAAAATCAA TTATACAAGC 
AATTAATTGA TATTCATTCT. CAATAACTGT GGTATGATAT GTAAGGAAAT CATGACTTAT 
GTGTGAGTGA ACGATCATCT ATACATCCGT TCACTTCATC TCATGACTTT CTATATTTAA 

rrmACAAG gagtgacatc tgtgaataac acacaatctt caccacgcag taatattatt 

ATTGCGATTA TGTTGTCTGC ATTAACATAT TGGTTGTTTG CACAATCATT TATTAATATA 
GGACCTCTCG TTGGTCAAAC ATATCAAACC TCTCCTGCCG TGTTAAATTT ATCTATTAGT 

ttaacttcct tcgccacagg tatcttcatg gtggctgcag gtgatattgc tgataaaata 
ggacaactga gaatgacata catgggtctc ataatcagta tgtttgcatc tcttctatta 
attatatcgg acatcactgc actgctcatc atcggtagaa ttttacaagg tctatcagca 
gctatcttgt taccttcaac agttggcgtg ttaaataatc aatttaaagg agaacattta 
agacgagcga ttagttatct aatgattagt actgttggtg gcatcggcct agctggtgtt 
atcggcggtt taattgcctc aaatttcgga tggcaaacga atttcatcat tagtatagtc 
attgctttca ttgccatatt gcttctaaaa ggcacacctg aaaaagtaag tcaacatagc 
caccgtcatc cattcgatta caaaggtatg tcgattttcg ctgttatgat tggtagcttt 

ACATTATTGT TAACACAAGG ATTCGAACAA GGTTGGTTTA GTACATTTTC AATCATTTGT 
CTGAGCATTT TTATCaTCAc TACGTTGATA TTCATCATCA TCGAACGTCG ACATGAAGTA 
CCTTTTATTG ATTTCTCAGT ATTACGCAAC CGTCCGTTCA TTGGTGCATT TTTAAATAAC 
TTTGTTTTAA ATAGCGGTCT AGGCGTAACA GTGGTCTTTT TCATATATGC TCAAACACAC 
CTTGGTTTAt CAgcTGCGCA ATCTGGACTT GTTACATTGC CATATGCCAT TGTGGCAGTT 
GCGATGATTC GTTTAGGTGA AAAAGCAACA TTACGTTTCG GTGGCAAATT GATGCTCATC 
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TCACAATATG TCATTGCAGT TATCATTGGT TTCGTCATAT GTGCGATAGG TAATGGTTTA 
GTCGCAACAC CTGGACTTAC GATTGCAATT TTCAGTATGC CTAATGAAAA AGTTGGTTTA 
GCTACAGGAT TATATAAAAT GAGTGGTACA TTAGGTGGCT CCTTTGGTAT AGCACTAAGT 
ACTACAGTTT TCAGTATGTT ACAACTAAAC TATGCACCAA GTGTAGCTGC AACCGTAACA 
TTTATAGTCA GCATTGTATT GATGATCCTT GGCTCATTGT CTGCATACAT GATCATTCCA 
AAAACAGTTA AATCTTAAAT ATAATAGAAG AATTATGTTT CGAAATATCT TTATCACTTT 
AAAATGATAT ACAAGAAATC CAAGAAAAAT AAGCGAACTG AATAAATAAA GATTCAATTA 
ACGCATCAGT ATTAGGATTC ACTCTAAAAC GATTAATAGT TTTATAAGAA GGTGTTTGAT 
CTTGAGCTAA CCACATCATT CGAATACTGT CATGAAGTAA TTTCTCTATT CTACGACCAG 
AAAATACAGA TTGAGTATAT GCATATAAGA TGATTTTTAA CATCATCTTT GGATGATAGG 
20 ATGTTGCGcC ACGATGATGT CTGAATTCAT CGAATTTGCT ATCAGGTATC GTTTCAACAA 
TTTCATTAAC ATGTCGCGAA ATATCATTTT GAGGAATTCT AACAGAAGTT TTTATTGGTA 



15 



25 



30 



GTGTAAGTTG jSGCAAAGTGT CTTATTTTTT TAAAGTATTT CAAAGTAAAA TTACATGTTA 
ATACGTAGTA TTAATGGCGA GACTCCTGAG GGAGCAGTGC CAGTCGAAGA CCGAGGCTGA 
GACGGCACCC TAGGAAAGCG AAGCCATTCA ATACGAAGTA TTGTATAAAT AGAGAACAGC 
AGTAAGATAT TTTCTAATTG AAAATTATCT TACTGCTGTT TTTTAGGGAT TTATGTCCCA 
GCCTCTTACT CTAATTATAT TCACTATCAA TTAGACAAAA TGGCCATTTT CAAATATCAC 
GCGTTGTTTC TGACCTTGAA TATATTTATT ATAATTCTCT TTTTGAAAAT. CAGTTAACAT. 
TAATTTAGAT GTACCGTATT TTAACACTTT TTGCATTGTT TCTATTCTCA TTTTTCTAAA 
TAACCATCCA TCTTTTAACA CAATACGATT AACAGCATCA TATGATAATT CTACTGTTTC 
TTTAATTTCA AATGTCTTGA ATGAAATAAT CGTGCACATT AAAAACGTAT CACCAAAGTA 



40 ATAAACATCT AAATCATCAC GTTTATGTTG TCCAACTAAC AAACGACCAT ATTCGAACTC 
TTTTTCTGGA TATTTCAATT CTAAAAAACT AATAATCTCT TCTTCTTTTA ATTTGAATTG 
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CATTTAAAAA CATCCTCTCT TAAGTTTTAA CAAGCCTTAA TTAAAAATTT TTTCAATCAC 
ATAGTTCAAT ATACATCATT TCGTTATGTT TTTTAATACT TTGTTCAAAA ACAAATATTT 
TATTCTTTAA AATAATGACT TTTGTATTTT TAATCACAAT AAACATTTTA AAATTCTTGT 
TATCATAATC ATTAAAAGGT ATTAACCTTA ATAATATATT CTCTCGTCTC AACCTTAATC 
GTATACTTCA' GACGTCTGTT TGTAGACAAT AAAAGTCATT CACGTCTTCA TATGTCATCA 
AATGTTTATC ATGATATGAT GAATATAATA ATCGGGTATA TAACTGTATG ATTAATTACA 
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. TGGTGTATCA GTTACAACTG TGTCACATAT TTTAAATCAT AATGATAGTC GTTTTTCCGC 6840 

AACAACGATA AAAAACGTAC ATGCTGTTTC AGAACGTTTA GGCTATGCCC CTAATAAACA 6900 

TGCAAAACAA TTGCGCGGCA GTAAAATTCA AACTATTGGC GTCATTTTGC CTAGCTTAAC 6960 

AAATCCGTTT TTCTCAGCAC TGATGCAAAG TATTCATGAC CATAAACCAT CTGATGTTGA 7020 

TTTATGCTTT TTAACATCTA CAGCAACTGA TTTGTATGAC AATATTAAAC ATTTAATTGA 7080 

TCGAGGTATT GACGGATTAA TTATCGCACA ATACATATCA TCCCCGGACG CCCTAAATAA 7140 

.CTATCTAAAG AAACATCATG TACCTTATGT CGTACTGGAT CAAAATGACC ATCAACGCTA '7200 

TACAGATTTT GTTCGGACAA ATGAATATCA AGGTGGACAA CTTGCAGCAC AACATTTAAT 7260 

AGAACTCX3GT CACAACCATA TGATAATTGT TGCACCATAT GACATGATGG CX3AATATGTC 7320 

GACTCGTGTC GCTGGATTTG TCGATACTTT GCGCGCGAAT CAATTGCCAG AACCACAAAT 7380 

20 CGTCCATACT GAATTATCTA AGCGCGGTGG GCTAACCATT GTTGATGACA TCATGGTTCA 7440 

ATCTGCCACT GCAATCTTCG CTATTAACGA TGAACTCGCT ATTGGCATTT TACGAGGACT 7500 

AATTGAACAT GGCATCAGTA TCCCGAAAGA TATCTCATTA ATAGGTTATG ACGACATTGA 7560 

TTATGCAGCG TACGTCTCGC CACCTTTAAC TACTGTGGCA CAACCTATAA CTGATATTGG 7620 

CAAAACATCT TTAACCTTAT TACTTCAACG ATTACAGCAC TTAGATAAAT CCATTGATAT 7680 

GATTGAATTA CCAACGACTT TAAAAATTCG TGCAACAACT GGCTATCATC TTTCAAACTA 7740 
ACTACGTATC TTCCGAAATA TACTCATCAT TGTTAGGCCC TTAGCGTTGC TTTAATGCTG .7800 

AGGGTTTTTA ATCATAATTA TTTTACTAAG AAATTAAAAT AATAATGTAT GAATTTTTAA 7860 

• -• . • . • • 

ATATGATTTA AACGTTTTCA GTTTTTATGA AAACGCATGC ATTTTACAAA TAAAAATGGT 7920 

ACGATGGCAC TGGTAAAACG TTTTACTAAA AACAAATCAT GAGGTGTATA ACATGAGCAT 7980 

TGTTGCATTA CTTATCGGGT TAGGCCCCTT AATTGGCTGG GGCTTCTTCC CAACAGTCGC 8040 

40 TTCAAAGTTT GGTGGTAAAC CTGTACATCA AATTATCGGT GCTACTGTAG GTACGTTAAT 8100 

CTTCGCTATT TTATTAGCCG TAGTCACATC AAGTGGCTTC CCTACTGGAA, CCAATTTGCi: 8160 

ATTCGCCTTA TTATCAGGTG CAGGATGGGG ATTCGGACAA ATCATTACAT TTAAAGCGTT 8220 

CGAATTAGTC GGCTCATCTC GTGCCATGCC AGTCACAACA GCATTCCAAT TATTAGGCGC 8280 

ATCTTTATGG GGTGTCTTTG CATTAGGAAA TTGGCCAGGC ATTGGTCATA AAATCATTGG 8340 

ATTTACAGCT TTAGTCGTTA TTCTAATTGG AGCGCGTATG ACAGTTTGGA GTGAACGCAA 8400 

AGAAGCAAGT AACGCCAAAA ATTTACGTCG TGCAGTGGTA CTTCTGTTAA TTGGTGAATT 8460 

TGGATACTGG TTATATTCAG CTGCACOGCA AGCAACTTCT ATTGATGGCC TAACTGCCTT 8520 
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AGCAGAGAAT CCATTCCGTA ATAAAATTAC GTGGTTACAA ATTATTTCAG GTTTCTTCTT 
TGCATTTGGT GCTTTAACAT ATCTTATTTC AGCACAACCT AATATGAATG GTTTAGCAAC 
TGGATTTATT CTTTCTCAAA CATCCGTTGT GCTTGCTACA TTAACTGGTA TTTATTTCTT 
AAAACAACAT AAAACGTCAA AAGAAATGGT TATTACAATC ATCGGCTTAG TACTCATTTT 
AC5TAGCCGCT TCTGTTACAG TATTTATAAA ATAAGGAGTG TAGATGTCAT GAAAAAATCA 
GCTGTTTTAA ATGAACATAT TTCAAAAGCA ATCGCGACAA TTGGTCATTT TGATTTATTA 
ACGATTAATG ACGCTGGCAT GCCAATTCCA AATGATCATC GTCGTATCGA CCTAGCTGTA 
ACTAAAAACT TACCACGCTT TATT6ATGTC TTAGCTACAG TGTTAGAAGA AATGGAAATC 
CAAAAAATAT ACTTAGCAGA AGAAATAAAA GAACATAACC CTACACAATT GCAACAAATT 
AAACAATTGA TTTCATCGGA AATGGAAATC ATTTTCATTC CXCACGAAGA AATGAAAAGT 
AACTTAGCTC ACCCATTAAA TAAAGGTAAT ATTCGTACTG GTGAAaCAAC GCCCTACTCT 
AATATTGCAT TAGAATCGAA TGTTACTTTT TAAAAGTTAT AACTTGAAAG GAGCGTACAC 
ATGACCAACA AAGTTGTTAT TTTAGGTTCA ACGAATGTCX5 ATCAATTTTT AACAGTTGAA 
AGATATGCAC AACCAGGCGA AACATTACAT GTTGAAGAAG CACAAAAAGC ATTCGGCGGA 
GGTAAAGGTG CCAACCAGGC TATTGCCACT GCACGCATGC AAGCAGACAC AACATTTATT 
ACTAAAATTG GCACTGATGG CGTTGCTGAT TTCATCTTAG AAGATTTTAA AGTAGCTCAT 
ATTGATACAT CATATATTAT CAAAACAGCT GAAGCAAAAA CGGGCCAAGC CTTTATCACT 
GTGAATGCAG AAGGACAAAA CACCATCTAT GTTTATGGTG GTGCGAATAT GACXSATGACA 
CCTGAAGATG TTATTAACGC AAAAGACGCT ATAATCAATG CAGACTTTGT CGtTGCACAA 
TTAGAAGTAC CCATCCCGGC TATTATATCT GCATTTGAAA TTGCCAAGGC ACATGGTGTG 
ACGACAGTAT TAAATCCTGC ACCAGCGAAA GCATTACCTA ATGAATTATT ATCATTAATC 
GATATTATTG TGCCAAACGA AACAGAAGCC GAATTGTTAT CTGGGATTAA AGTAACTAAT 
GAACAATCTA TGAAAGACAA TGCCAATTAC TTTTTATCtA TAGGCATTAA GACTGTTTTG 
ATTACGCTAG GTAAGCAAGG TACATATTTT GCTACTAAAA ATCAAAGCCA ACACATCGAA 
GCTTATAAAG TAAATGCGAT TGATACAACT GCTGCAGGCG ACACATTrAT TGGTGCATTT 
GTCAGTCGCT TAAACAAGTC GCAAGATAAC TTAGCAGATG CTATTGATTT TGGTAATAAA 
GCGAGCTCAC TCACTGTACA AAAACACGGC GCGCAAGCAT CTATTCCTCT ACTAGAAGAA 
GTAAATCAAG TTTAAATGAA TCAAACACAG .CTATGATATG AAGGTTTAGC ATATAACATG 
CAACATTCGT ATATCATGGC TGTGCTTTTT TATCTTTATA AAACATCATC TATTAGAAAT 



8640 
8700 
8760 
8820 
8880 
8940 
9000 
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9300 
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9420 
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10140 
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TTTGTAATCT TTTTAACTTC CAAATTaTCG CATATAAATA TGCTATATTA ATGATAATAA 
TTATCAATTA AAAGGAGGTT ATGCTATGTC TAAAGAAGCT GGTCATACAT TTTTAGCTAA 
ATTAGGAAAA ACTCGTCTAC GCCCCGGTGG TAAAGAAGCA ACAGATTGGT TAATACAACA 
AGGGGCATTT TCACAAGATA AACAAGTGTT AGAAGTGGCA TGTAATATGT GCACAACATC 
TATTTATCTA GCTCATACAT ATGGCTGTCA CATTCAAGGC GTTGATATAA ATAAGAAAGC 
ATTAGAAAAA GCACAGGAAA ACATTTCAGC AGCAGGTCTT GAATCATATA TTCAAGTTCA 
ACAAGCGAAT GCTGTTAAAT TGCCCTTTGA TGACAATCAA TTCGATATCG TTTTAAATGA 
AGCAAT6TTA ACAATGTTAC CCATCGCCAT AAAGGAAAAA GCATTACGCG AGTACTACCG 
AGTCTTAAAG CCTGGGGGTA TCTTGTTAAC ACATGATATT GTCATCGTTA ATGAATCACA 
TGCCACACAT GTTGTTAAAT CATTATCTGC AGCAATTAAT GTCAATGTCT CACCGCAGAC 
GAAACTTGGC TGGTTAGATT TATATAATCA AGCTGGTTTT AATCATGTGC ATTATCATAC 
TGGTCCAATG AGTTTAATGA CACCAAAAGG TTTAATTTAT GACQAAGGTA TTGTTGGAAC 
TATAAAGATT ATCAACAATG CTTTGAAAAA AGA/UUVTCGA CCAATGTTTT GTAAAATGTT 
TAAAACGATG ACTAAATTGC GTAAAGATAT GAATTATATT ACTTTTGTCG CTAAAAAAGA 
GCACTAAATA TAATGCCACT AACTGTACTT TGTATCTATG TTTGACTATC ACTTTAATTT 
CTTTGTGACA CTAATCATCT ACTTAACAAT ATCGTTATCG TTGATTAGTA AGTCATCAAT 
nTGGTTAAA GACTTTCATA AACACTCAAA CATTAACACT ATACATAGTT AGTGGcATTA 
TTTTTTyCTn AAAATTTTAA CmTCmCGGGr TtGGGAmCrG AAaXGrtAwT TcGCrmAAtT 
TAwTcT 

(2) INFORMATION FOR SEQ ID NO: 445: 

(i> SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2176 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
. (D) TOPOLOGY: linear 
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11280 
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11460 
11466 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 445: 
TTACATAGTT AACACTAGTT AATCTATTAG TTAACATTAG TTAATAATTA GTTAATTTCC 
ATTTGTATTC TCATGTGATA AATTCTAAAA GCATACaATA AATTTAATAT GTAAAAAGAA 
AGGGAATACA CATGAAAAAT AAATATATCT CGAAGTTGCT AGTTGGGGCA GCAACAATTA 
CGTTAGCTAC AATGATTTCA AATGGGGAAG CAAAAGCGAG TGAAAACACG CAACAAACTT 
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AAGTATTACA TCTAAAAGGT ATCACAGAAG AACAACGTAA CCAATACATC AAAACATTAC 360 

GCGAACACCC AGAACGTGCA CAAGAAGTAT TCTCTGAATC ACTTAAAGAC AGCAAGAnCC 420 

CAGACCGACG TGTTGCACAA CAAAACGCTT TTTACAATGT TCTTAAAAAT GATAACTTAA 4 BO 
CTGAACAAGA AAAAAATAAT TACATTGCAC AAATTAAAGA AAACCCTGAT AGaAGCCAAC ' 540 

AAGTTTGGGT AGAATCAGTA CAATCTTCTA AAGCTAAAGA ACGTCAAAAT ATTGAAAATG 600 

CGGATAAAGC AATTAAAGAT TTCCAAGATA ACAAAGCACC ACACGA7AAA TCAGCAGCAT 660 

ATGAAGCTAA CTCAAAATTA CnTAAAGATT TACGTGATAA AAACAACCGC TTTGTAGAAA 720 

AAGTTrCAAT TGAAAArGCA ATCGTTCGTC ATGAT6AGCG TGTGAAATCA GCAAATGATG 780 

CAATCTCAAA ATTAAATGAA AAAGATTCAA TT6AAAACAG ACGTTTAGCA CAACGTGAAG 840 

TTAACAAAGC ACCTATGGAT GTAAAAGAGC ATTTACAGAA ACAATTAGAC GCATTAGTTG 900 

20 CTCAAAAAGA TGCTGAAAAG AAAGTGGCGC CAAAAGTTGA GGCTCCTCAA ATTCAATCAC 960 

CACAAATTGA AAAACCTAAA GTAGAATCAC CAAAAGTTGA AGTCCCTCAA ATTCAATCAC 1020 

m W 

CAAAAGTTGA GGTTCCTCAA TCTAAATTAT TAGGTTACTA CCAATCATTA AAAGATTCAT 1080 

TTAACTATGG TTACAAGTAT TTAACAGATA CTTATAAAAG CTATAAAGAa AAATATGATA 1140 

CAGCAAAGTA CTACTATAAT ACGTACTATA AATACCAAGG TGCGATTGAT CAAACAGTAT 1200 

TAACAGTACT AGGTAGTGGT TCTAAATCTT ACATCCAACC ATTGAAAGTT GATGATAAAA 1260 

ACGGCTACTT AGCTAAATCA TATGCACAAG TAAGAAACTA TGTAACTGAG TCAATCAATA 1320 

CTGGTAAAGT ATTATATACT TTCTACCAAA ACCCAACATT AGTAAAAACA GCTATTAAAG 1380 

CTCAAGAAAC TGCATCATCA ATCAAAAATA CATTAAGTAA TTTATTATCA TTCTGGAAAT 1440 

AATCAATCAA AAATATCTTC TCTAGTTTTA CATC A TTTT T TAAATAATTT TCGTAACAAA 1500 

CCGTGATTAA AAAGAACCGT TGATTCTCAA TCGAATCTAC GGTrCTTTTT TCATTTTCCA 1560 

40 TCAATTAAAT GCTTCTTCGC TATTTGTCAO CCCACTTTTT TACCTGCAAC TTGTTAAATA 1620 

ATCCTTACAT CGTTAACGAA TAGrTCATCA TTTAGTTGAA TCAGCTCAAC TTTATTAACT 1680 

TCATATTTTC ACAAACTATT GCGCAATCCA TTCCTTTTCC ACTACAAGCA CCATAATTAA 1740 

ACAACAATTC AATAAAATAA GACTFGCAAA GCATAGTTAT GTAGCTATAT AAACGCCTGC 1800 

GACCAATAAA TCTTTTAAAC ATAACATAAT GCAAAAACAT CATTTAACAA TGCTAAAAAT- 1860 

GTCTCTTCAA TACATGTTGA TAGTAATTAA CTTTTAACGA ACAGTTAATT CGAAAACGCT 1920 

TACAAATGGA TTATTATATA TATGAACTTA AAATTAAATA GAAAGAAAGT GATTTCTATG 1980 

ATTAAAAAtA AAATATTAAC AGCAACTTTA GCAGTTGGTT TAATAGCCCC TTTAGCCAAT 2040 
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CmTyCAAArG AcACaGACAT TACTAGCCAA CGATTTAGCT ATnACTCCAA ACCTTCCATT 21S0 

GGATTTGOTA AAGGnT 2176 
^ (2) I^rFORMATION FOR SEQ ID NO: 446: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1557 base pairs. 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 44$: 

75 

AAAAGCATGG CTTAAATGAA GTACGCTATA ACAAATTACA AGAACATGCT ATTGTTATGC 60 

ATCCGGCACC.TGTGAATAGA GGAGTAGMA TACAAAGCGA TTTAGTAGAA GCTTCAAAAT 120 

- CAAGAATTTT TAAGCAAATG GAAAATGGCG TTTACTTAAG AATGGCAGTC ATTGATGAAT 180 

TATIAAAATA GGTAAGGGGA CGAAAATGAT GAAATTAATT AAAAACGGTA AAGTATTACA 240 

AAATGGCGAA TTACAACAAG CAGATATTTT AATTQATGGT AAGGTAATTA A^CAAATTGC 300 

2S ACCTGCAATT GAACCAAGCA ATGGTGTTGA CATCATAGAT GCGAAAGGTC ACTTTGTGTC 360 

ACCTGGATTT GTCGATGTTC ATGTTCATTT ACGTGAACCT GGTGGTGAAT ATAAAGAGAC 420 

AATTGAAACT GGTACTAAAG CTGCTGCTAG AGGCGGATTT ACAACTGTAT GTCCAATGCC 430 

• - * ■ 

TAACACAAGA CCGGTACCAG ATTCTGTAGA ACATTTTGAA GCTTTACAAA AATTAATCGA 540 

TGACAATGCT CAAGTACGTG TATTACCTTA TGCTTCAATT ACAACACGTC AATTAGGTAA 600 

AGAATTGGTT GATTTCCCAG CACTAGTAAA AGAAGGTGCC TTTGCGTTTA CAGATGACGG 660 

35 

TGTAGGAGTA CAAACTGCAA GCATGATGTA TGAAGGCATG ATTGAAGCTG CAAAAGTAAA 720 

CAAAGCCATC GTAGCACACT GTGAAGATAA TTCATTAATC TATGGTGGTG CAATGCATGA 780 

AGGGAAACGC AGTAAAGAGT TAGGTATACC AGGTATTCCA AACATTTGTG AATCTGTTCA 840 

40 

AATCGCAAGA GATGTACTAT TaGCTGAAGC AGCAGGTTGT CATTATCATG TATGTCATGT 900 

TTCTACTAAA GAAAGTGTTA GAGTCATTCG TGACGCTAAA CGCGCAGGCA TTCATGTTAC 960 

^ AGCTGAAGTT ACACCACACC ATTTATTGTT AACAGAAGAT GATATTCCTG GTAATAATGC 1020 

CATTTATAAA ATGAATCCAC CATTGAGAAG TACTGAAGAT AGAGAGGCTT TGTTAGAAGG 1030 

GTTACTAGAC GGTACAATTG ACTGTATCGC AACAGAcCAT GCACCACATG CACGTGATGA 1140 

SO AA?\AGCACAA CCAATGGAAA AAGCaCCATT CGGAATTGTT GGTAGTGAAA CAGCATTCCC 1200 

ATTATTATAT ACGCATTTTG TAAAAAATGG TGATTGGACA TTACAACAAT TAGTAGATTA 1260 
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TTATGCAGAX TTAACAATCA TTGATTTAGA TAGTGAACAA GAAAXTAAAG GAGAAGATTT 
CTTATCAAAA GCAGATAATA CACCATTTAT CGGCTATAAA GTTTATGGAA ATCCGATCTT 
AACAATGGTT GAAGGCGAAG TTAAATTTGa GGGGGATAAa TArTATGCAA gCAAACGTTA 
TCTAGTGTTA GAAGACGGTC TTTTACGAGG CTACCX3TTA6 . GTCTGATAAC TTACTGA 
(2) INFORMATION FOR SEQ ID NO: 447: 

(il SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1799 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 447: 



GCTAGAAATm TTGmATGaCA ATACAACTCT 


GTTAAAaTGA 


TGGACGTAGA 


CAAATATGCG 


TATTGACGCT TTAriTrAAA 


AATTclACATG 


CTTATAACAT 


GTTTATAGAA 


GGAGATTAAC 


CTATGAACTA TCaAGTTCTT 


TTATATTATA 


AATATATGAC 


GATTGATGAC 


CtGAACAGTT 


TGCTCAGGAT CACTTAGCCT 


TTTGTAAAGC 


ACACCATTTA 


AAAGGTAGAA 


TTCTTGTTTC 


TACAGAAQGT ATTAACGGCA 


CATTATCTGG 


TACAAAAGAA 


GAAACCGAAC 


AATATATGGC 


ACATATGCAT GCCGATGAAC 


GATTCAAAGA 


TATGGTGTTT 


AAAATTGATG 


AAGCTGAAGG 


ACATGCTTTT AAGAAAATGC 


ATGTACGTCC 


TCGAAAAGAA 


ATCGTTGCTT 


TAGATTTAGA 


AGATGACGTC GATCCAAGAC 


ACACAACTGG 


CCAATATTTA 


TCACCTGTAG 


AATTTAGAAA 


• 

AGCTCTTGAA GATGATGACA 


CAGTCATTAT 


TGATGCACGT 


AATGATTATG 


AATTTGATTT 


AGGTCATTTC CGAGGTGCAA 


TTCGTCCAAA 


TATCACACGT 


TTTAGAGATT 


TGCCTGACTG 


GAITAAAGAG AATAAAGCGT 


TATTTGCAGA 


TAAAAAAGTG 


GTTACGTACT 


GTACTGGTGG 


CATTCGATGC GAAAAATTTT 


CTGGATGGCT 


TTTAAAAGAA 


GGTTTCGAAG 


ATGTAGCTCA 


ACTTCATGGC GGTATTGCTA 


CATATGGTAA 


AGATCCTGAA 


ACAAAAGGTG 


AATATTGGGA 


CGGTAAAATG TACGTATTTG 


ATGACCGTAT 


CAGTGTTGAT 


ATCAACCAAG 


TTGAAAAnAC 


AATTATTGGT AAGGATTGGT 


TTGATGGCAA 


ACCATGTGAA 


CGTTATATTA 


ATTGCGCTAA 


CCCAGAATGT AATAAACAAA 


TATTAGTTTC 


TGAAGAAAAC 


GA^^CTAAAT 


ATTTAGGTGC 


ATGCTCTTAT GAATGTGCTA 


AACATGAGCG 


TAATCGTTAT 


GTTCAAGCAA 


ATAATATTAG 


TGATAATGAG TGGCAACAAC 


GTTTAACAAA 


CTTTGATGAT 


TTACATCAAC 


ATGCTTAGTT 


TTAATTAAAT ACCTTTCAAA 


ACACGCTTTG 


AAAATCCGAT 


TTATAAAGGT 


TTTTCAAGGC 
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TAAATTTTAA TACTGCGGGG TGTCTTAAAA TGCACATTTT AGTAACAGGG TTTGCGCCTT 1260 
TTGACAATCA AAATATCAAT CCCTCATGGG AAGCTGTGAC TCAACTAGAA GATATTATTG 1320 
^ GCACACATAC AATCGATAAA TTAAAACTAC CAACCTCTTT TAAGAAAGTA GATAATATTA 1380 

TAAATAAAAC GTTGGCATCT AATCATTATG ATGTTGTACT AGCTATAGGA CAAGCTGGTG 1440 
GTAGAAATGC CATTACCCCA GAACGTGTCG CCATTAATAT TGATGATGCA CGTATTCCAG 1500 
ATAATGATGA TTTTCAACCT ATTGATCAAG CCATTCACTT AGACGGTGCG CCAGCTTATT 1560 
TTTCAAATTT ACCaGTTAAA GCAATGACTC AAAGTATTAT TAATCAAGGA CTTCCTGGAG 1620 
CACTTTCAAA TAGCGCAGGT ACATTTGTTT GTAATCACAC ACTTTATcAC TTAGGTTATT 1680 

75 

TACAAGATAA GCATTACCCT CACCTACGAT TCGGATTTAT TCaTGTGCCA TACATACCAG 1740 
AGCAGGTcAT TGGTAAACCC GATACACCAT CTCATGnCCA TTGAGGAAAA GATnAGTTG 1799 
(2) INFORMATION FOR SEQ ID NO: 448: 

20 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1341 base pairs 

(B) TYPE: nucleic acid 

CO STRANDEDNESS : double 
25 (D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 448; 

ACTTGGTTTT TTATTGTTTA TAAATAAAAC TCACTTAATA ATGTTTTCAT AATCTTCTTC 60 

GACTACTTAA TTCTTTAAGA TATTCGTGAA AAGAGACATT ACACTAGTTA ATTTTCAAAC 120 

AATACAAAAA GCGTCTACCT CCTACATATA ATTGTAGCGG AGATAGACGC TTAATATTTA 180 

35 

TTTAAAAATT ATTTTAAACC ACCGAATGTC ATAACATCAC GGGCAATCAT ACTTTCTTCA 240 

TCTGTTGGAA TAACGACAAC TTTAACTGGT GAATGAGGAT AGTTAATAAA TCCTTCmA 300 

CCACGTAGTA AGTTTTCATT TTTCTTAGGA TCCCAGTAAA CACCCATAAA TTCTAAGCCT 360 

40 

TCAAGAACTT TCGCACGAAT TTCTACTGAG TTTTCACCGA TACCTGCTGT AAATACGATA 420 

ACATCAACAC CATGCATTCT CGCAGCATAT GATCCAATAT ATTTGTGAAT TTTAGAAGCA 430 

AATACATCTA AAGCCATTTG TGAACGTGCT TTACCTGATT CAGCTTCTTC TGATAAGTCA 540 

45 

CGTAAATCAC TAGATGTACC TGATAATCCT AATAAACCTG ATTCTTTGTT TAAGATTTCC 600 

AATACTTGTT CAGCAGTTTT ACCTGTTTTT TCCATAATAA ATGGAATTAA AGCAGGGTCA 660 

SO ATATTACCAG AACGAGTACC CATTGTTACA CCAGCAAGTG GTGTGAAGCC aTTGATGTAT 720 

CAATAGATTT ACCGCCATCG ATAGCTGCAA TTGATGCTCC ATTACCAATG TGACATGAAA 780 
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TATGGCTTGT ACCATGGAAA CCATACTTAC GAATGCCATA ATCTTTATAA TAATGATATG 
GCAAGCTATA TAGATATGCT TTTTCAGGCA TTGTTTGATG GAATGCTGTA TCAAAAATTG 
CCACATGAGG GATATTTGGT AATAATTTAC GGAAAGCACG AATACCCAtC AAGTTaGCTG 
GGTTGTGaAG CGGTGCTAAT TcGCTTAATT CTTCAATTTC CTTTTCAACC TCATCAGTAA 
TAGCTACTGA TTCAGGGAAT TTTTCACCAC CATGTACAAC ACGGTGACCT GTTCCATCGA 
TATCGTTAAT ATCATTAATA ATATTGTGCG CTTTAAAAGC ATCCAACATG ATATCAACTG 
CCTCAACGTG ATCCTTGATA TCTTGTACTG TTTTAACTTT TTCCCCGTTG ACTTCAATTG 
TAAAAATTGA ATCCTTCAAT CCGATTCTTT CTACTAAACC TTTTGTTACT AATTCCTCTT 
CAGGCATTCT AATTAATTGA A 
(2) ICIFORMATION FOR SEQ ID NO: 449: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1529 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDBDNESS : double 

(D) TOPOLOGY: linear ' 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 449: 
TTTTGAAGAT ACTACCGATG AAAATAGACA AAAGATTTTT CAATATTTAT CACCTGAAgA 
AGTTGCAAAT TTCTTTGATC AATTAGATAT TGATGACGAT GAATATGAGT TGCTATTTGA 
TAAGATGAAT GCGACATACG CAAGTCACAT ATTAGAAGAA ATGTCATACG ACAATGCAGT 
AGATATTTTA AAT6AGTTGA CTAAACCAAA AGTTGCTAGT CTTTTAACAT TGATGAATAA 
AGATGACGCG AATGAAATCA AAGCATTACT TCACTATGAT GAGGATACGG CCGGCGGTAT 
TATGACGACG GAgTATTTAT CACTTAAAGC GCATACGCCT GTTAAAGAAG CATTATTATT 
GGTCAAAGCG CAaGCACCAG ACGCAGAAAC AATATATGTT ATATTTGTCG TTGATGATGA 
TGGTAAATTA GTAGGTGTTT TATCGCTAAG AGATTTAATT GTAGCTGAAA ATGATGCTTA 
TATTGAAGAT ATTATGAATG AACGTGTCAT TAGTGTGAAT GTAGCAGACG ACCAAGAAGA 
TGTTGCTCAA GTTATGAGAG ACTATGATTT CATGGCTGTA CCTGTTATAG ATTACCAAGA 
ACATTTGCTT GGTATCATCA CGATTGATGA TATTTTAGAC GTTATGGATG AAGAGGCTAG 
TGAAGACTAC TCTCGTTTAG CCGGGGTATC AGATATCGAT TCGACTAATG ATTCAATCAT 
TAAAACAGCA TTAAAACGTT TACCATGGTT GATTATTTTA ACATTTTTAG GAAT6ATTAC 
TGCGACAATT TTAGGGAGAT TCGAAAAAAC ATTAGAAAAT GTAGCGCTAC TCGCAGCGTT 



60 
120 
180 
240 
300 
360 
420 
430 
540 
600 
660 
720 
780 
840 
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TCGTAACATT ACGAcAGGGG AAATTAATGA GCAAAGTAAA TTTAGAATTG CATTAAGAGA .950 

AGCAGGAAGT GGTGTATTAT CGGGTGTTGT ATGTTCAACA ATATTATTTA CAATTATTGT 1020 

* TGCAATATAT CATCAGCCAC TTTTAGCATT AATCGTTGCA GGAAGTTTAA CTTGTGCGAT 1080 

GACGGTGGGG ACGTTTGTAG GTTCGATGAT TCCATTATTG ATGAATAAAT TAAATATCGA 1140 

TCCAGCAGTG GCTAGTGGAC CATTTATTAC AACAATTAAT GATATTATTA GTATGTTGAT 1200 

10 

TTATTTTGGT TTAGCTACAT CATTTATGGC TTACTTAATT TAAGGAGGAG TTATGGAGTT 1260 

TTTATCTTTA GTTATTGTTG TTTTAGCAGC GTTTTTAACT CCAATAATTG TCAATCGATT 1320 

AAATATTAAT TTCTTGCCAG TTGTTGTTGC AGAAATTTTG ATGGGGATTG TGATTGGAAA 1380 

IS ■ 

TTCATTTCTA AATATAGTAG AAAGGGATTC AATTCTAAAT ATTTTATCAA CGTTAGGCTT 1440 

TATCTTTTTA ATGTTTTTAA GTGGTTTAGA AATTGATTTT AAAGCTTTTA AAAAAGATAA 1500 

ACGCGCACGT CAAGGACAAA ATGATGATG 1529 

(2) INFORMATION FOR SEQ ID NO: 450: 

<i) SEQUENCE CHARACTEJIISTICS: 

(A) LENGTH: 1827 base pairs 
25 (B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 450: 

TTCTGGAAAC CAAAGTATTG TCATCTTCTA CTAGTAGTAT nGGCATCCAT ATCACCCAAT 60 

ATCATTTAGT ATATTTCATA TTTTCTCCTG ATTTTAATCG ACTTTGAAAA TCTTTAATCC 120 

35 

GGCAGTCAAC TTCAAAGCCA TGAATCATCA TTTTTTGCAT TGGTGCTTGT ATAAAGTAAT 180 

AAATCGGCCA AAATAATCGA GGGATATAAT CGTATAGATG TATATAAACG ACTGCCGACT 240 

CTTTGATTAA TCTAAATTCT AACTTCCCTT GATTAACTGT ATATTTTTTC ACTAAACTTC 300 

40 

CACTCAATAA AATTAAAGTT ATTATTCCAT CAGCTGTTTC TTCTATTTTA AATACTGCQA 360 

GCGGTCGCAC CTTATTCTTA ATATATATCT TAAATTGATC ATGTGATTTT TCTGTTTTCA 420 

CAAAAGTTCC TTTAGTGTAA CCCATCCATG CAATAAAATG GTTTACAACG TTCTTTAATG 480 

4o 

TCCATCCCTT TGGTAAAACT ACCTTCATCG TTGATCTAAC ATCATCATAC TTTGAAACTT 540 

GTAATTCTAC ATTAACTAAA GAACGTTTAA AAACTAAATT TGTTGTTTCT ACAGGTGTAC 600 

SO CATATGCACC TAGGCGTTCA ATTGTTTCAT TATCATAACG ACTCCCAGGT ATGTAGATTA 660 

CTTT TT TTAC TTGATTGATA GCCGCTGCTC GACCAAAATT ATCTGCTGCG ATTAATGTTA 720 
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CAGCAATATC TATTTGATTC ATTGCTGCAA CAACCTGTTC GTAATGAAAT ATATCACACT 840 

GAATCCAAGT CATTTCAACA TCATCTGTTT kTTTATTGTC TGGATATTTT GATATAGCAA 900 

5 AAAGTTCAGC ATCATTTTCA ATCACTTCAC TTAAATACTT ACCAATATAT CCTGTTCCAC 960 

CTGCTAATAA AACTTTAGGT TTCATCTAAA ATACTCCTTT AAACTGTAAC CAAAAAACAT 1020 

ATTACTCCAC CTTTTAGTTA CATATATATT ATAATAGTAG CAAATGTTTT AAAATTTCAA 1080 

AATACTGGAG GCTTTTTATG GCCCATATTA TACGTAGAGT TAGTATCAAA GATGTAGAAA 1140 

ATTTCATTTC AATGTTAGCG AACATATACG ACGAATCTCC GTATATGTTC TACACACCAG 1200 

GAGAATATGA TCCTAGCGTC ACATCGGCTA GTAAACAATT AGAAGAATAT ATCACTTCTC 1260 

75 

CGCATAAAGT CATCTTCGTT GCTGAAAGTG ATGAACAACT CGTTGGCTTT GCCTTTGTTA 1320 

ATACGACACC ATTTCAACGC ATTAAACATG TTGCTAAAAT TGATTTAGGT GTAAAGAAAT 13 80 

TATATCAACA TCGTGGAATT GGCCAAGCAC TTCTTGATGC CATTATGGCT TGGTGTTTAA 1440 

20 

ACAATCAAAT ACACCGAATT GAAGCAAATG TACCACTCAA TAACCAACCT GCCCTCGAGC 1500 

TTTTTAAAAG TGCCGATTTT CAAATCGAAG GCGTTTTAAA AGATAAGTTA TTTATCGATG 1560 

25 GTAAATATTA TGATGACTAT ATGATGGCTA AAATTCTTAA TTAAAGCTAT TTTATCATAA 1620 

TCTTGTATCA GAATCGTATA ACAACGAATT TAATGGTTAC CTAATACATT ACTCATACTT 1680 

ATCAATGTTA TCTAATCTCA AATAAATACG TACACTCTTA TTCATTTATC AAATTTAAAT 1740 

30 TCAAAATAnA ACACCACTAA TGTGTAATTG ATTAACTATC AACTACGATT AGTGGTGCTT 1800 

TATATATGTG GTTAGTTTTC CTnACTA 1827 
(2) INFORMATION FOR SEQ ID NO: 451: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 616 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

40 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 451: 

ATATAGATTA ATGTTTGTTA TTTGTACTGT GTTTGCCAGT GACATTTATT ATAAAACATA 60 

45 

TGACGTTATT CTATGJcTGTA CTCATTtTCT ATATTGTAGG TTTATTAACG ATTAGAAGTA 120 

TTATTAAAAA GTTGAAATAT CAGGAAACAT TATTACGAGA CTAAAAAACT TCCATTGGCA 180 

SO TGTATGTTGT AAAGGTGCAT GTAATGTTGA ACGCCAAATG ATACGGCGTT CAGATTACAT 24 0 

TAGCATCTAT ACGTTAACAG CATAACCAAT GGAAGTTTTC TTCGAATCTA TTCTTTTATT 300 
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AATGCGTCTT TTGAAAAATG GTCATTAAAG GCATCAGATT GCTTAAAGTC TTCGTATGCA 420 

TGTCGATCAG CAAATCCGAA ATAAATTTTG TATGTTGTAC CTTTAGCAGG TCTTAACAAA 4B0 

CGATAGCTTT TAAAGCCACC AAAGTTTCTG AAATTATCGT CTACACTAAT GAGTTTCTTT 540 

TCAAGTTGAT ATGCATGATC TTCTGTTGAT GGaATGAAgA TTGCACaATA GAAATGaTGT 600 

TCACtGAATT CACCAA 616 



10 

(2) INFORMATION FOR SEQ ID NO: 452: 

CD SEQUENCE CHARACTERISTICS: 

{A) LENGTH: 944 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 452: 





^^^^ Ik ^^^^ ^ ^^n^.^^ ^ 

GCACGAGTGA 


TTAAACGGTT 


AATuAATvjAA 




CAAATTACAT 


TGAAGTTATT 






GAGGGAGGAA 


TTGAAGAAAC 


GCAAACGTTA 


ATTCACTTAC 


CTTTTGACTA 


TGTCTTCTTT 


120 


25 


ACAGGAAGTG 


nAAATGTAGG 


CAAAATCGTT 


TATCAAGCTG 


CCAGCGAAAA 


TTTAGTTCCT 


180 




GTGACATTAG 


AAATGGGCgG 


TAAAtCTCCa 


GTCaTCGtTG 


ATGAAACAGC 


GAATATTAAA 


240 




gTTGCTAGTG 


AGCGCATTTG 


TTTTGGGAAA 


TTCACTAATG 


CCgGCCaAAC ATGTGTTGCa 


300 


30 


CCAGATTACA 


TTITAGTACA 


CGAATCTGTA 


AAAGATGATT 


TAATCACAGC 


CCTATCAAAA 


360 




ACGTTGCGTG 


AA'rrri'ATGG 


TCAAAATATA 


CAACAAAGTC 


CAGATTATGG 


CCGCATTGTA 


420 


35 


AACCTTAAAC 


ATTATCATCG 


TCTGACTTCA 


TTACTTAACA 


GTGCACAAAT 


GAATATTGTA 


480 


TTTGGTGGTC 


ATAGTGATGA 


GGATGAACGT 


TATATAGAAC 


CAACATTGTT 


AGATCACGTT 


540 




ACAAGTGATT 


CAGCAATTAT 


GCAAGAAGAA 


ATTTTTGGTC 


CTATCTTACC 


GATnTAACG 


600 


40 


TATCAGTCAT 


TGGATGAAGC 


AATAGCCTTT 


ATTCACCAAA 


GACCAAAACC 


TTTGAGTTTA 


660 


TATTTATTTA 


GCGAAGATGA 


AAATGCTACA 


CAACGTGTAA 


TAAACGAGCT 


ATCATTTGGC 


720 




GGCGGCGCTA 


TTAATGATAC 


ATTGATGCAC 


CTAGCGAATC 


CTAAATTACC 


ATTTGGTGGT 


780 


45 


GTTGGTGCCT 


CAGGTATGGG 


ACGCTATCAT 


GGTAAATATT 


CATTCGACAC 


TTTTACACAT 


840 




GAAAAAAGCT 


ACATTTTCAA 


ATCnACACGA 


TTAGAATCAG 


GTGTCCATTT 


ACCACCATAT 


900 




AAAGGTAAAT 


TTAAATrCAT 


CAAAGCTTtC 


tTTAAAnATT 


AATT 




944 



(2) INFORMATION FOR SEQ ID NO: 453: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4 820 base pairs 
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10 



25 



30 



35 



50 



(C) STRANDBDNESS : double 

(D) TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 453: 

TCTCCAGTAG ACCTTGTGTA TGAACAGTTT CTTTCATATG AATGAACATC GTTTTTAAAG 60 

TTTGTTTCAA CTCAGCCTTA TCAGGATAAT ATCTAGAGAC AGTCGTCTCT GGCATCTCCA 120 

TTGTATGATA TTTAACCTTA TGCAGCGACC CATGATTTTC GTTATAAACA AATGTATGAT 180 

TCACTTCATC GAAATCATGA TCTTCTCCTG CAATCCAAAA AACTGGTACT ACTTGTTGCT 240 

15 TATGTGTATC CGTTAATTCC TTAGATAAAG TAATGATTGa AAATATTTTA TGGAATGTAT 300 

ACAATGGTCC CCCGAAAAGC CCTGCTTGTT GTCCACCAAT CACAACTTTT GAACCATTAG 3 60 

CTAAATGTTG TATGTTTAAT TCTTGTTCAC TTGAAAGCTT GAAAGCTTTA AATCACTCAT 420 

ATATTCACGA ATAACATTCG CTAATGCCGC TTCTCTTCCA TTATTTTCTT TAGACATCCT 4 80 

TTTTTCAAAA CTAGTTTGTT GAGCTGCATC ATATTGAAAT AATCCTGTTA TTACAGGGTC 540 

ACTGCTCTTT ATTTTTGGTA TAAACTGATC TTTTTCATTT AAACTAACTA CTTTACAGTC 600 

• CATOmTTT CTCCTTAAGT ACGCGATTAC AAACTATAGT ATAAAGTCTA TACCGGTGAT 660 

TGACAATTTT ACGGCTTGAA AATCAATTTA ATCATGGAAA ATTTATAATA TTCATTGTTT 720 

TACATTTTCA AATCAATGAA AAACACAAGT GGTTTAATGT ATAATAATAG TAGTAAACAA 780 

ATAAGGGGTA GATAAATATG AGTGAAATCA AACGTCTTGA AATTAATTAC AAAACTGACG 840 

AATTATTCGA AAACTTTAGA GCGTTTGGCA ACAAAGACTT ATACATGGTC AATGAGTTAA 900 

ACGGTCAAAT GATTGATGCA AGTTCAGATT CACCATTTTA TGGCATATTT GTCGaGATCA 960 

ATTAGGAGCT AGAATGGCAT TACTAAAAAA AGGTGATGTC GAAGAAATCT ACTTCCCAGA 1020 

TTTTGAAGAT TATATATTAT TATGGAAGTT AGAAGTATTA CCAAAATATC AAAACAGAGG 1080 

40 GTACGCTTCA GAATTGATTG ATTTTGCAAA GAGTTTCAAT ATGCCAATTA AAGCCATTGG 1140 

CAGAAATGAT TCTAAGGATT TCTTTTTACA TCATGGATTT ACAGATGTGG AAGCTAAAAA 1200 

TATAGAGGGA CATGATGTCT TATTGTGGAA ACCATAAGAT AATAATATTC GACACTACGA 1260 

GCATGAAAAT GCATCTTTTC GTAGTGTCTT TTTTACAATT ACTTTCTTAA GCTAATATAA 1320 

GTaAATCATT TTCAAATTAT TTGTCTTAAC GTACAATATC ATTTAGTTGT TTCCATGrAT 1380 

TAATTTCATA ATCAGGTATA ATTCCTGGAT TATGATCAAA TCCTCTAAAa TTAAACCAGC ,1440 

AAGTAGCTAT ACCcGCATTG ATTCCACCTA GAATGTCAGA TGTTAnAGAA TCTCCaACTA 1500 

TAATCGAGTG CTGtCTTTCA TCCTCACCAA TATCATTAAA AACATAATTA AAAAATTCCG 1560 
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ACGGCGTCTG ATTTAACCTT CTCTTTTGCG 
AATCATGTCT TTTCGATAAT TCGACAATTG 
^ TAGCTTCTGC TAATCCATTT CTAAATAACA 

GATGATGTTT GAAGTAATTC ACAAATCGTT 
TTTGkTGAAA AGCTTCCCAA TGTTGGTGaT 

10 

TTGTTGCTTT ATGATTAAAA ACATTCGCCA 
AAAAATCAAC AATTGTATCA TCAAAGTCTA 
TCTCCTATAT TGTCTATGTA TCTAAATCTT 

15 

AAACTGAGTG CATAACATTA AAGTATGCTC 
TATATTAGAA TCCAAATAAT TTACCTAGTA 
TACTTGTGCC TAATTTCACA CTATCATGTT 

20 

CTTCTGCTAG TCCAGTCATT TAAATCTCTC 
CATAACATAT TGAAATTAGA ATCCGAATAA 

2s GATGCTCACA ATGCTTGTGC CTAATTTTGC 

ATCTTTAATT GCGTTAAATA AACCTTCCAT 
GATAACAAAA ACGTGCGTAg yTTTTAAATC 

30 GTTGTTATTT TAAAATAAAT TTGATGCAAT 
TGTACTTAAC TGTATTTTAA AGAGAAAAGA 
ACACAATTAA GTTGCCTGAA TTCGTATTTA 
TCTATAATAG TGAAAAATAT AAACATTTTT 
TTTAGATATA ATAATTCTTG TGTTGTTAAA 
ATGGCCTTCT AAGCCATCGG TCGGGGGTTC 

40 

TTATACGCAT TACCAAACAA AAGAGTTCCG 
CAGTAATATA GTATGATGCG TCACCAAAAC 
ATTAAAACAA GCATGCTTAT TCGTTATAGA 

45 

ACACTTGTTT ATACATTTTT AATTAAGTAA 

CTGAACTACA CCAACACTAC ACCAAGATTT 
TTTTATTATT ATATTATTCC TATAGATTTT 

SO 

GGGGCCCGAA ATCCTATAAT TATAATTATA 



TTTCGGTTAC ACCATTAGTA ACAATATATA 16 BO 

TTTCTAATGT TTGATCAAAG TATTTAACTT 1740 

CATCTGCACG ATGCCCATCA ACTTCCATTT 1800 

CTGATAATAC TTCAGACTTC GkTAATTTAT 1860 

TGaTTTTTTT AAATGkTAAA AAATCATCCy 1920 

TATAGTGAAn CGCCCATTCT TCTGcATCAT 1980 

TCAAAATATT TTTATATCCC AATTTCCCCA 2040 

AACAGAGGCT CAAATTTCTG CAAATAAAAT 2100 

ACCCAGTTTA TTTTAAAGAA TATTAGTTAT 2150 

AACCCACACC GTTAGCAACG ATGTCTACGA 2220 

GTTGTGCAGC TTGCACAGTA TTTGCGATTG 2280 

CCTCACCTTT GAAATAATAC TGATTACTTA 2340 

TTTACCTAAT AAACCTACGC CATTTTCAAC 2400 

GCCATCATTA TTAATTGCTG CAGTTACGGT 2460 

TGAAAACACT CCTTAAAATT TAAATTTGAA 2520 

ACCGAAATGT TATTCGCTTA ACGTTTTGTT 2580 

TAGTTTGTTT A7CCGCACAA CATCTTATAA 2640 

AATACAGTTA GGCATTCAAA ACTGTATTTA 2700 

AGTCTTATTG AACCTTTTTA GATAAATAGC 2750 

TATTTACAAG GTATTGCTAA TTTAAGTTCA 2820 

CGTGTCCTGG TAGCTCAGCT GGATAGAGCA 2880 

GAATCCCTCC CAGGACGTTT ATAGGTATTT 2940 

TGATTACGGG GCTCTTTTTG TTTTGAATTT 3000 

GTCCCCCGCA TAAGCCCCGA AAATACAGTA 3060 

ATTTTTTGAC ACACAATTGA CACGCGTCTG 3120 

TTTTGTGCTC AAATTTCATC TATACTGCAC 3180 

TTAACACTCA CCATTTGCAT GCGTAGAGAT 3240 

GATACTATTC AAAATTTTAG GGACTTTTCA 3300 

TACATCTAAA AAAAATAACC ACGTCCATCG 3360 



55 



1367 



EP 0 786 519 A2 



10 



IS 



20 



ATACTATTGG CAAATTTATA AAGTAGTTCA GCGTTTTTCA ATGACATATT GTCTAATGAT 34 SO 

CTTTCATTTT TTCTCATTCT GTGTATTGTG CTTTGTGGAA CTCCTGTTTG TTTCGATATA 3 540 

TGTAAACTGC XCAAATCACT GTCTAATAGT TTTTGAATTT GATTTCTCAT TTTGTACACC 3 600 

CCCTTGTAAA TCTTCAATCA TCATTTAAAT TAAATAATTA CTTTTCCACA TATTCCAATA 3660 

TTTAGGTTGC AAAGCATACC TCAAATATCA TTAATTTTGA GATTTAAATG TCAATTATGT 3720 

GTCTATCAAT CCAATATACA TACTCTAATA ACGTAATACT ACACACTCTT CTTATTAATr 3780 

GGCCATAGCT ATCATGATAT AATTAGTGAA GAAAATCACA TAAGAAAGGT TGTAAATCAT 3840 

GAGACTTCAA AAAGCACCTC TAGTAACGTC AGGACTAGTC TTAGGATTAT TAGGCCTGGG 3900 

TAATCTATTA AAAGACTTAT CTCTTACTTT AAACGCTGTT TGCGGAATCT TTGCTTTCTT 3960 

GATTTGGATT CACCTTTTAT GTACTATGAT CAAATATTTT AATAATGTGA AAGAACAATT 4020 

AAACAGTCCT CTAGTTTCAT CAGTGTTCAC AACATTTTTC ATGTCTGGCT TTTTAGGTAC 4 080 

TACTTATTTA AATACATTTT TTAGTAACAT AACTTTTATC AATAGCTTAA TAACGCCTAT 4140 

TTGGATTTTA TGCCTTGTGG GAATTATGAC GCATATGATT ATTTTTTCAA TAAAATATTT 4200 

25 AAAAGATTTT TCACTTGAAA ATGTTTATCC TTCGTGGACT GTACTTTTTA TTGGTATTGn 4260 

TATCGCAGGA TTGACGGCAC CCGTTAGCGG ATATTTTTTC ATAGGTCAAT TAACAGTAAT 4320 

ATATGGCTTT GTAGCTACTT GTATTGTCTT ACCTATAGTT TTCAAGCGAT TAAAAGCATT 4380 

30 TCCATTGCAG ACGTCAATCA AACCGAACAC ATCGACAATT TGTGCACCAT TTTCTTTAGy 4440 

CGCTGCAGCA TATGTTATAG CTTTTCCTAA GGCGAATGCT TTTATCGTAA TTATATTTTT 4500 

ACTATTAGCT CAAATATTTT ATTTITATAT CATTATACAA TTGCCTAAAT TACTAAAAGA 4560 

ACCTTTTTCG CCCGTATTTT CAGCTTTCAC ATTCCCTTTA GTAATCTCAG CAACTGCTTT 4620 

AAAGAACAGT TTGCCTGTAC TTATGTkTCC AGACATTtGG AAAGGlcCTTT TGTTTATCGA 4680 

AGTGTTATTA GCCACTGTAA TAGTACTTAG AGTCTTTATA GGATATCTTC ACTTCTTTTT 4740 

AAAAAAGGAA AAACAAGATA AATTTCTnCG TAATGCGTCT CAGTAACACT ATTACCAAGA 4800 

ATTAACACGT ATATTTAATA 4820 
(2) INFORMATION FOR SEQ ID NO: 454: 



35 



40 



45 



SO 



(i) SEQUENCS CHARACTERISTICS: 

(A) LENGTH: 4353 base pairs 

IB) TYPE: nucleic acid 

(C) STRANDEDNSSS : double 

(D) TOPOLOGY: linear 
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ATTTCGATCT TTAATATCAC CAATATTTTT AATATCTTCC GGATTCAATC CATATACTTG 
TACTGTATCT GAGTATTTAA TTGTGAAATA ATCACCTGAT TTAACTTTGT CATCAACTGT 
AATTTGTGAT TTTAATGATA AATAATCTTG GGCTGGTACG ATTTTATTGT TTTTATCTGC 



ATCAACGACA GTtAATGTTG TATTTGATGT GATTAAATCA TTAACATTTT TAGCCTCTGT 240 

TGATGATGGC TGTACTGCTG CTATACGCAT TCTTGTATTC AAACGTTTAG GTGCTGTACT 300 

TTTTGGCAAA ATGATATCTG CATTATTTTC ATTATTTGAA TTACTATTGT TATCAACAAG 360 

AGTTTCATCA TTACTCTTGA TAGCATCACT TTTAACATTT AATGTAGTTG ATTCAGTTTT 420 

GGCATCTACC TTTTTGTTTT CCTCATTAGT TGGTTGAACA TTTACCACTG ATTTATTCTC 4 80 

TTGCAAATCA GGTTGTAACG CTTCTTGATT ACTTATAGTT TGTTTAGTGT TTAAATCTTC 540 

ATTCGTAGAT TTTGGTGAAG CTTGCTCATC TGATTTGGCA GTTGAAACTT CAACTTTATT 600 

TCCAGTGGTA GATTGTACAC TTTCTTTTTC TATTAATTTA TTCCCATTTG AAGTCGTTTC 660 

ATTACCTTGa GATGATACCA TTTCTTTTTG ATTATCATTT TTAGTATTGT CTTCTTGATT 720 

TAGTTGCTGC ATATCAACTT TATCACTCGA TTGATTATCA CTTGCTGAAG TTGTCGCTcG 7 80 

TTCAATTCTT TATTAGTACT TTCTGCAGCC TTTGCITCTT GGTTCCCCAG ACCAAAAATT 840 

AATGTTGTAC CTACTAAAAT TGATGCTGTT CCCACTGTGT ACTTTCTAAT CGAAAATTTA 900 

TTTAATCGAT TGGATACCAT GCCTTTCCTT GTTATTGCCG TTTTATTTTC TCTGTTTAGC 960 

ATTAGATTAC TCCTAATTCA TCAAATTTTT AAATAATACA ATTGTTTTAA ATACAAAAAT 1020 

GTATATCAAT ATAGTATTAC ATTTTTAGAT AAAGCACAAT ACTTTAATTA TTTTTCTTTA 1080 

TCGTAAAACG TTATTTAACA TTTGTGTTTA AATAAAAGTT TTTATGAGTt TTGTAATCTT 1140 

TATTTAATCA TCATAAAAAA TAGTATTATT TGCCCTTGAA ATTAATATCT TAGCTTTTCT 1200 

AATTCATAGA CAATTACATT TCTGTAACAA ATTAAATTGT ATCTATTCCT TAAAGATTTT 1260 

TTGTTTTATA TCTGGGAATT TCTAAACAGA AAAAACCAGG CCACATGGAC CTGGTTAAGT 1320 

TAATCATATT ATTTATTTTG TTTTTTACGA CGACCGAATA ACAATAATGA TCCTAATGCC 1380 

GCGAATAATC CACCGAATAA TGTGCCATTA TTTGAATTAT TATTTTCACT ACCTGTTTCT 1440 

GGTAATGCTT TAGCTGTTTT ATGCTGATCT TTAACCGTAC TCATTGGTTT AGCCGGAGTA 1500 

TGTTTACCTG CATCTGAATC TGAATCGCTA TCTGAATCTG AGTCGTTGTC TGAGTCCGAA 1560 

TCGCTATCTG AATCTGAGTC GCTGTCTGAA TCTGAATCGC TATCCGAGTC TGAGTCGCTA 1620 

•TCTGAGTCTG AGTCGCTATC TGAATCTGAA TCGCTGTCTG AGTCTGAATC GCTATCTGAG 1680 

TCTGAATCGC TGTCCGAATC TGAGTCGCTA TCTGAATCTG AATCGCTATC TGAATCTGAG 1740 
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TCTGAATCTG AGTCGCTGTC TGAATCTGAA 
TCTGAATCGC TGTCAGAATC TGAGTCGCTA 
^ TCCGAATCGC TATCTGAATC TGAATCGCTA 

TCGCTATCTG AGTCTGAGTC GCTATCCGAG 
TCTGAATCTG AATCGCTATC TGAGTCTGAG 

10 

TCGCTATCTG AATCTGAGTC GCTATCTGAG 
TCTGATGTTT CTTCTTCGTA GTAGCCATTA 
GTTACATCAA CTTCGCCACC ATCGGCATCT 

To 

TGAGTTAAGC CAGCAGGTTT TTCAAAGATA 
AAGCGGTATT TACCATTTTC ATCTGTyTCA 
20 TGCAAAGTAA CTTTAACACC TTTAATTCCT 

TTACTGTCGT ACCAAACATA ATCACCTAAA 
TCTAATGTCA TGTTGTCAGC GTCTTTAATG 
ACAGCATCAT CTGTACCTAC ATTTGCAGTT 
TCTACACTAT AAGTTCCATT GCTTAAACCA 
GTCGTACGAT CTAATTCTTT ACCGTTACTA 

JO 

CCTTTTTCAT TGGCATCTTG TTTACCATCT 
AGATTATATT TCTTTTGGTC GCCATTAGCA 
TTTGACCAAC TATATTTAGT TTTGTCAGTG 

35 

GTTGAACTAT TATCTGGATA AGCAACTTGT 
TGGCCTTTCA TTAAATCGAC TGTAGCTGTT 
40 TGATCAGTAA CATCTTTAAG TTTTGAAGTA 

TGATCTGtCA CTtCGTAAAT TTTGAAGTTT 
AAATTAGTAA CAAACGTTTG TTTAGTATAT 
ATATTACGCG ATAAATCTTC ATTGTTAATA 
TTTTTATTAC CATAATCGAC AATGATTTCT 
TCCATTTTAT AAGCTGTTTT ATCAGTTGTT 

SO 

TCAAAGCTAC CTCTAACATT TGTATATTGA 
GTGTTTGTTG TACTATCATA AATACCTTTT 

55 



TCACTGTCTG AGTCTGAGTC GCTGTCTGAG I860 

TCTGAGTCTG AATCTGAATC ACTGTCTGAG 1920 

TCTGAGTCTG AGTCGCTATC CGAATCTGAG 1980 

TCTGAATCGC TGTCTGAGTC TGAGTCGCTG 2040 

TCGCTGTCTG AATCGCTGTC TGAATCTGAG 2100 

TCTGAATCGC TGTCAGAATC TGAGTCGCTA 2160 

TCAAGTGTGA AATCATCATG ATCCGTAATT 2220 

TTATCATCTT CAGTTGTATT TGTACCTGTT 2280 

ACTTTGTATT TACCACTATC TAAATTATCA 2340 

GTTGTACCAA TTACTTCGCC TTTTTCGTTT 2400 

TTTTCAGTCG AATCTTGTTT ACCATCTTTA 2460 

CTATATTTTG GTGTTTTGTA GAATCCACTA 2520 

ACACCTGTTG TAGTTAGTCC ATCAGAATCT 2580 

GTCGGTGTAT AACCGGCTGG TGTTGAAAAC 2640 

GTGAACTGAT ATTTACCATT TTCATCTGTT 2700 

TCTTTAAGAA TGACATAAAC ACCTTTAATC 2760 

TTATTTGTAT CTTCCCATAC ATAGTCACCT 2820 

GTTGATGAGC CATTCACATT TGAATAACTA 2880 

TCTAAAGTAT AATCAATTTT TCCATTATCT 2940 

TGAATGATGT ATTGTTTATT GCTGCTTGTT 3000 

TTATTATCAT TACTATAAAT AACATCGAAT 3060 

TCAGGGGTGA AACTATCCAC AAATTGATTT 3120 

TTTGCATTTG GATTAAATTT ATATCCAGTT 3180 

GTATTTTTAG GTTGATTTAC ATATGCAGTC 3240 

TAGTTTGTAC TTGAAATAAG CGGTTGTGCT 3 300 

TCGCTATATG TATCATTACC TAAAGTTACT 33 50 

GCATTTTTAC GTTTCGCAAA TGCAACTTGT 3420 

TCTACATAGT TCGTAAAAGT ATATGTTGTT 3480 

GCAATAATAT TACCTTGGGC ATTATATAAA 3540 
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GTAAATGTAT CGCCCTCTTT AACAGAATCA TCGATTGTGT AATTTGCTTT TAATTTTAAA 3660 

ACATCACTTG AAGTTGCCCA AAATTCAGTT TTACCAGTAG TCTGATTAAC ATGTCCTTTA 3720 

TCAATCGCAA TGTCAATATT TGAAAAATGT ACTTTATCAT TAACATTTGT TCCTTGTTGT 3780 

GGAGCTGCAA CAGTATTCAC TGCCATGCGA TTTAAAGTTC TTGGTTTAAT AGTCGTTGTT 3840 

TTAGGTGTAG TTGAAACATC TTTTGCTTGT GTTAAATTAC TTTTATCAGT TTCATTACTA 3900 

TATGTAGTTG ATGATTTATC ATTTGTTGTT ACATTGCTAG TTTTTGTAGT AGATTGATTA 3960 

GCTGTAGCGT TTTGTGGTGA TTGCATGTTA CTACTAGTTT CTTTAACTGT TGCACTATCA 4020 

CTCATTGTCA CTTTAGGCTG ATCTGCAGTT GCAGTTTGCG TATTGTCTTT TAGTTGACGA 4080 

CTATCAACTT TTTTAGTTGT TTTATTCTCA CTTGGGGCTG TCGTTTCATT TTTTGATTGA 4140 

TTTAATTCTC CATTCGTATG TTCTGCCGCT TTAGCTTCAT GACCACTTAA CCCAAAAATC 4200 

20 AATGTTGTCC CTACTAAAAT TGAAGCAGTA CCTACAGAAT ACTTTCTTAT CGAAAATTTG 4260 

TTTAATCGAT TTGGTATCAT GCCTTTnCTA TTTGTnGCTG TCTTTTTATA ATTCATTTAA 4 320 

TAATACTCCT TTAAAATATC AAAATTTGAT AAATATAA 4353 
(2) INFORMATION FOR SEQ ID NO: 455: 



15 



25 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1060 base pairs 
{B) TYPE: nucleic acid 
30 (C) STRANDEDN2SS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 455: 



45 



SO 



TTGACTTCTT 


AATTCAGCAT 


TTTCTGCACT 


TAATGCTTTG 


TTCTTTTTAA 


TAAGTTGCTT 


60 


TCTTGCATAA ACTTCGGTAT 


CTArrrrACT 


ATTACTATAC 


CTTTGATTTA 


AAACTAATAT 


120 


ACCAATTAAT 


GCTACAATGA 


TAATGATAAG 


TACAACATAA AAAGACATTT 


TTTCACCAAT 


180 


CCTTTTTGAC 


TTCTTTAACT 


TTGTATACAA 


TAATAATTAA 


TAAAGATTAA 


TTGTTATTCA 


- 240 


ATTTCCCACA 


TTTTTATTAG 


TTGATTTTAG 


TTCATCATTG TTATAATCAA ATTATAAACT 


300 


GACAGATATT 


GATGTTCAAT 


GAATATGACG 


TGAAAGATTC 


GTGAATTCAA GTTTATGTCG 


360 


AATTTATGTT 


ATAACGGTCA 


TTTAAATGAC 


AGAATTAGGT 


CACTCATAGT 


ATTTTGAAGA 


420 


TTGAATTCAT 


TAATTTTAAA 


ATGTATAATG 


ATATTTGTGA 


AAGCGCTTGC 


TTAGGAGGTG 


480 


TATTTGAGAG 


TGAATGAAAT 


GAATGCTAAA 


GAACAATTAG 


TGGACAATTT 


AATGAAAACA. 


540 


TCATCGCAAT 


TATTTAAATT 


TCACGGTGAA 


GTTGCCATGC 


AGCTTTTCTT 


AAATGATGAA 


600 
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AAAGTTATTC CGCAATCATA TGCGTTACTA TACATAGATA AGCAAGATCA AGCAATAGCT 720 

AAAGAAGATT TATCACTTTC AAAAATTGCA AAAGTTTATG TGCAATATGA TGATACAACA 780 

5 ATAATGAGTA TTTTCGTTTA TGATGTAGTA AACGATGAAT GGATTTTTAG ATTGGATCCXJ 840 

AATATACGTA TACCTAAGAG TAACATATAC TTCCATAGTT TAAATTGGGA TGTGGATATA 500 

TTAAACCGGA GtCGTCTAAT GTATGTCTAA TGCaCACCAT CAGaTCATCA TtATCCATTA 9$0 

TAAcGrGCAT AGTGCATAAn yACTwCAtXT TaTTaaATTG AGaGGgGCAC GATAGGTGCA 1020 

TCAGGACATA ATATAGGAAG CATCAACGCG TOAllCAGGTC 10 SO 



(2) INFORMATION FOR SEQ ID NO: 456: 

15 

<i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1262 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

20 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 456: 

25 ATAATnACTA AATACnAAAG TTTAACTGTC TTACTAATAA TGACTATGTT ATAATTTTAA 60 

AAGTGATATT TTGGGTAATC GCTATATTAT ATAGAGGAAA GTCCATGCTC ACACAGTCTG 120 

AGATGATTGT AGTGTTCGTG CTTGATGAAA CAATAAATCA AGGCATTAAT TTGACGGCAA 180 

30 TGAAATATCC TAAGTCTTTC GATATGGATA GAGTAATTTG AAAGTGCCAC AGTGACGTAG 240 

CTTTTATAGA AATATAAAAG GTGGAACGCG GTAAACCCCT CGAGTGAGCA ATCCAAATTT 300 

GGTAGGAGCA CTTGTTTAAC GGAATTCAAC GTATAAACGA GACACACTTC GCGAAATGAA 360 

GTGGTGTAGA CAGATGGTTA TCACCTGAGT ACCAGTGTGA CTAGTGCACG TGATGAGTAC 420 

GATGGAACAG AACATGGCTT ATAGAAATAT CACTACTAGT TTAGCTCTCC TAGATGATGG 480 

AGAGCTTTTT TCATGAAAAG AACACTTAAA ATTAACGCCy TGTCTTGaTA tAATGACaCT 540 

40 

GCcTTGTTTT AAAATAGTAA GCGGATGCgT TAATGTATCA GCGATTAAAT TTGTTGGAAA 600 

TGTATAAAAA ACACAAGCTA AGAATAAAAT ACCTGTATAA AAGGAGAATC ATATATGTTT 660 

CAATTACTTG CAGTTTGTCC GATGGGATTA GAAGCTGTTG TTGCTAGGGA AATTCAAGAA 720 

45 

TTAGGCTATG AAACAAATGT TGAAAATGGT CGTATATTTT TTGAaGGAGA CGCAAGTGCA 780 

ATTGTAAAGG CAAATTTATG GTTGCGCACA GCAGACCGAA TCAAAaTTGT TGTTGGACGT 840 

SO TTTAACGCAA CAACGTTTGA CGAATTATTC GAACAAACCA AAGCGCTCCC TTGGGAATCT 900 

ATAATTGATA AAGAGGGTAA CTTCCCAGTT CAAGGTAGAA GCGTTAAATC AACACTACAT 960 
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TATAACGAAA AAGGTTGGTT AAATGAATCA GGTGCCAAAT ACCCTGTTGA AGTTGCCATT 1080 

TTAAAAGATA ATGTATTATT GACTATCGAC ACATCAGGTT CTGGTTTGAA CAGACGTGGT 1140 

TATAGATTAG CACAAGGTGA AGCACCAATT AAAGAAACGT TGGCAGCAAG TTTAATCCGT 1200 

CTTGCCAAAC TGGGAAAGGT GATTACACCT TXnAATTGGT CCCATTTGCG GTTCnGGTTA 1260 



(2) INFORMATION FOR SEQ ID NO: 457: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1142 base pairs 

(B) TYPE: nucleic acid 

1$ (C) STRANDEDNSSS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 457: 





CCTGGCTGCT 


TTATCAGCAT 


CTACTACTTT 


AAAACCGAAT 


ACGGATAAGA 


GTTCTGATAC 


60 




TGTTGATTTT 


CCTGAGGCGA 


TTCCACCTGT 


TAGACCAATA 


ACTTTCGGCA 


TAATTTCACT 


120 


Off 


CTTTCTTTAT 


TTTTGACATA 


v> X V7VVA v*nn x t\ 


n 1 V7r\^ 1J\ L Li. 






loU 




TTCAATTTGA 


CTTCCACACA 


CTTTGCATAC 


CGGCTGCTTA 


TATACATTAA 


GATGCAATTG 


240 




CATCTCACCA 


GTTTTTCCAT 


CAGCATGACG 


ATAATCTGAA 


ATACTTGTAC 


CGCCATATTT 


300 


30 


AATACCTTCT 


TCTAGTACTT 


CTCTAACATA 


ATAAAAAACC 


ATTTCTTGTT 


GTTGGTGTGT 


360 




TAAGTCTTTT 


ACTTTTTTAT 


CTGGTAAAAC 


ACCTGCACGA 


AACAACGCTT 


CACATGCGTA 


420 


35 , . 


AATATTTCCA 


CAACCTGCGA 


TTACTTTATG 


ATCCAAAATC 


ACTTGTTTGA 


TTGGTTTATT 


480 


CTTATTAGAC 


TGTTGATGAA 


TTCGATTTAA 


ATAATACGTC 


AATGCTTCAT 


TTGAAAAAGG 


540 




TTCAGGCGCT 


ATTTCTAAAA 


ATGAAGGATA 


AGATGCTACA 


GACGCAACAT 


TTCTAATTTC 


600 


40 


TCCAAAACGA 


CGTATATCTG 


AATAAATTAA 


CTTTTTGTCA 


TTTGACAACT 


CAAAAATAAC 


660 


ATGCCAATGC 


TTACGATAAT 


TAGGTATCAT 


AATATCTTCA 


AGTTCATCTA 


CAATGAAAAA 


720 




ACCGCCCGCC 


ATACCTAAAT 


GACTAATTAA 


TGTACGTTGT 


TCTCGTTTAT 


TATCTAGCTG 


780 


45 


AAAAACGATA 


TATTTACTTC 


TTCGTTCTAC 


ATTTGTAATG 


GTATAGCCTT 


CCGATAAAGT 


340 




TTTAAAAGTA 


TCTAATTCAA 


TTCCTTTTAT 


AATTGTTTCC 


TTGCCTTGAG 


CTITACCTTC 


900 




GATTACTTTA 


TCCGAAAATA 


TAACGTGTTC 


AATTTTTTGA 


TTTATAACGT 


AGGGTTCAAT 


960 


SO 


TCCTCTTTTT 


ACATGTTCTA 


CTTCTGGTAA 


TTCGGGCATA 


CCATTAACCT 


CACTTTATTT 


1020 




TGCATCATAC 


CAGGTTGCAC 


CATAACTTGA 


GTCTACTTTT 


AATGGAACAT 


CTArTTGCAA 


1080 
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TT 1142 
(2) INFORMATION FOR SEQ ID NO: 458: 

5 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: IB 14 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

10 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 458: 

CCTTTAGTAA ACAATCCTTC TTTAGTTTTA GTACGTTGTT CCAATCCAAA TAATTTGTAT 60 

75 

TTCATTGCCT CGCCCGATTG AGTGCCGCTA AAGTTATCAT CTTTCATGTT AGGCGTGTTG 120 

GTAAACATGT GTATATCACT GTTTAAACGG TCTTTATAAG CTTCGGTACC TTGTACATCG 180 

TATTGCTTAT AAATATAACC ACCATCAACA GAGCCTTCTG TTTCTCTACC TTCGCTATCA 240 

20 

GCATAAACAG TCGGTTCTAA AAACAACACG TTAGCTTCCT TTTGTTTTCT AACTTCTACA 300 

GGATCTAAAT TTAAATTACC TTTAATAAGT AACATAGCGT CATTTAAATC ACTCATATAG 360 

25 TTAGCAsymy CTGATTCAGC ATTATCATAC AAATCAATTA AAGTGATTAC TTTCTCATAA 420 

V 

TCCCCTTTTC TTCTTTCGTT GTTGCTAAAT TCTGTAATAG GCATACGTTC GAAAGAGTGT 480 

GATTCAAAAC CGTTTTCACG TGGTGTGAGC TTCAATCCAT TTGTTCTACT GGTAAGATAT 540 

CTATAAACAC CGTGTGAAGT GAATAAATCA ACTGTAAACA CTTCATCTTC GTCAGTCTTG 600 

TCTATTGGTT TAGTTCTTAA ATATCTAACG CCTGCGATAC TATTACGTTC AATTGTATTG 660 

TCGTATATGA CAAAAGTACT CATTGCATCA CTCTTGTATA AACGCGTTTC ATCATCTTGG 720 

35 

TTTCTAATCA TTAACTCATA AGCTTTGCCA TAAATTGACA AATCTAATCC TAAAGATCTA 780 

TTGTGTGACT CAACATCATT TAAATCATTG AACGCCTCAA TAACTTCTAA TACATCTTTG 840 

TCATCATCTT GATATTGAAT TGGATTACCC AAGAAATAGC CGTTGATAAA ATCGCTAATA 900 

40 

TAAGATGCGT AATCATGCGC TACACGGTTA TCTGCCATGT ACTCTTCTTT GCGTCGTGTT 960 

AACTCAACTA AGTTCTTAGT TTTACCTTCG TAATAATCAC TTAACACTTT CAATCTAGGT 1020 

^5 CGTTGGTAAT CCATGTGATG TTCAATGTAT TTACTTACTT CATTAACGTT TTGTAATAAA 1080 

TCGGATTCCG TCCCGTCATA TGTGTAAACA ACATTGGCTT CATCATTAAA TAAGTAATTT 1140 

ATGTTTCCCC GTAGATCTGT ATCTGTTTCA AATTCGTTTA CTTTTAACAT TTGTTCCCTC 1200 

SO CTATAATCCT AGAGATTTTA TTGTGTCAAC TTTCGAACTG AGATTTGTGC GTTTtCTAAC 1260 

CGGTCTGTAG AATCGTTCCA CTGAATAACG CAACGAATCG ATACAATGAT TGTATGTATC 1320 
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CTCTTCAATA GTCTTGAAAC AACGTTCATC AACAATGATT TCAAATTGCA TTAAGAATTG 1440 

TAACCCTTGT ACAACCGAGC CCTTCCCTTT TTTGGTTGGT AAAATCCTTT TAAGCCCTAG 1500 

5 ATTCCTTAAT TCAGCTATAC TTTTTTGTTC TGCACTATCT GCTGTAATTT CTTCTTTAGC 1560 

ATAACCAAGT TGCTTTATGA CATTAGCTAT TTCATCATTC AGCATACCTT GTTTAACATA 1620 

CTCTTCAATG ATGTATAACT TCTTTTTCTT TACATCTATT TTAGAATGTA TAAAAGCACT 1680 

AGGATCATTA ACGTAGCCAA AGTCCAATCC AAAATAAGAA GGTAAATGTC TTAACTCATC 1740 

TTTATTTATT AAACGTTTTT CATACTTAGG GAAAACCAAT TTGTCTAGTG TAGCAAATTC 1800 

ACCTAACGCA TAAA 1314 
(2) INFORMATION FOR SEQ ID NO: 459: 



75 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 686 base pairs 

(B) TYPE: nucleic acid 
20 (C) STRANDEDNESS: double 

(D) TOPOLOGY; linear 



2S 



35 



. (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 459: 

AATTnAGATT ATTACCCTCC TTTAAAAATA TTTGTTTCAC AATTTTTTAT TACCTATTTA 60 

CTGGTTTCAT GTCTTATGGG GCATTTTACT TGTTGGTATT TGAAAATGTG CAAAATTTAA 120 

30 TCTTATATGT TTCTTGGCTT TTCATGACTA TGCTATTTAT GTTTATGAAT ATGCATTCAA 180 

TTATAGATAA AAAAGTACAT ATATTCTTAA AGTCTAATAA ATAGTTACAA ATTTAGTTAG 240 

TTTTCAATTG TTAATTAGGG GTGGTAAACA GTGCTTTGTG AATCTAGACA AATTTATAAA 300 

AATCCTAAAT ATCGAGTTAT TAGATATAAT AATGAATATT TCATGGTCGA TTTAGTAAGT 360 

ACTTGGATTA CTTATTTnT CCCTATGATT AATTGGTTTT TGCCCAAAAA ATACGCAAAA 420 

ATTAGCGAAA ATGAATTTGA AAGGTTAAAT ATAGTCGAGC CTGTTAAAAA TAATGTTTTT 480 

TGGCCGGTTG CAGGAAGTTC AGTTCTATTT GGAATTATAT TGAGAAAGTA CGGTAACTTC 540 

TTTAATGTTC AGTTTGAAAA ACAACTAGCA ATCACTGTAT TTTTTATCAT GTTAATAGGG 600 

ATGTTAATTT TTTATTTTTA TCTAAATAAA AAATTAACAT TAAAAATTTT TAATACCAAC 660 

GTGGGTAATA AGAATAGGAG TTGTAT 686 
(2) INFORMATION FOR SEQ ID NO: 460: 
SO (i) SEQUENCE OiARACTERISTICS : 

(A) LENGTH: 1300 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

55 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 460: 

^ ATCTGCAATT ATGGGCACAC CCAAGCTnAT GCAAGTAACT AAAGGAGAAG TACTTrTAGA 60 

CGGTGTAAAT ATTTTAGAaT TAGAAGTTGA TGAAAGAGCA AAAGCAGGAT TATTCTTGGC 120 

AATGCAATAT CCATCAGAAA TTACAGGTGT TACAAATGCT GATTTCATGC GTTCAGCAAT 180 

10 

CAATGCGAAA CGTGAAGAAG GACAAGAAAT CAACTTAATG CAATTTATTA AGAAATTAGA 240 

TAAAAACATG GATTT7CTAG ACATAGATAA AGACATGGCA CAACGTTATT TAAATGAAGG 300 

TTTCTCAGGT GGAGAGAAGA AACGTAACGA AATCTTACAA TTAATGATGT TAGAACCTAA 360 

75 

GTTTGCaATC TTAGATGAAA TCGATTCAGG GTTAGACATC GATGCATTAA AAGTTGTATC 420 

TAAAGGTATT AACCAAATGC GTGGGGAAAA CrXTGGTGCA TTAATGATTA CACACTATCA 4 80 

20 ACGATTATTA AATTACATTA CTCCTGATAA AGTACATGTA ATGTATGCTG GTAAAGTCGT 540 

TAAATCTGGT GGTCCAGAAT TAGCAAAACG TCTTGAAGAA GAAGGATATG AATGGGTTAA 600 

AGAAGAGTTC GGTTCAGCTG AATAATCTTA TTAATACAGT ATCCATGAGA TGTTCATCTA 660 

25 TATATGATGA AAATGAACAT TTATACQAAA TAGTAAATTT CATCAAGTAG GAGGAAAAAG 720 

TTATGACAAC TGATATTTTG rACaTTyCTG AAGAACAACT TGTTGATTAT TCTAAAGCCC 780 

ACAATGAACC TT C TTGGATG ACAGAATTAC GTAAAAAAGC TTTGAAATTA ACAGAAACTT 840 

TAGAAATGCC AAAACCTGAT AAAACAAAAT TAAGAAAATG GGATTTTGAT TCTTTTAAAC 900 

AACACGATGT AAAAGGTGAT GTTTATCAAT CTTTATCACA ATTACCTGAG TCAGTAAGAG 960 

AAATTATTGA CGTAGATCAT TCTAAAAACT TAGTAATTCA ACATAATAAT ACGATTGCGT 1020 

3S 

ACACACAAGT TGATGATAAT GCATCGAAAG ATGGCGTTAT CGTTGAAGGT TTAGCAGACG 1080 

CTCTTATGAA CCATAGTGAT TTAGTACAAA AGTACTTTAT GAAAGATGCA GTAACAGTAG 1140 

ATGAACATCG TATCACAGCG CTACACACGG CATTAGTTAA TGGTGGCGTA TTTGTTTATG 1200 

40 

TTCCTAAAAA TGTAGTTGTA GAACATCCAG TACAATACGT TGTGTTGCAC GACGACGAAA 1260 

ATGCAAGCTT TTATAACCAT GTTATCATCG TTACTGAAGA 1300 
45 (2) INFORMATION FOR SEQ ID NO: 461: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH; 3135 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 
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GACAGCAAAT TCAAGATACA TTAAATAAAG ATATTGTCAT AAAGCATATT CTTGTTCGAG 60 

ATAAATCTAA AAAGAGACCG CTAAATATTA GCCAATATCA TTTAACTGAA GATGTTAATX5 120 

5 AAATTTTAAA TGATGATTCA TTAGATATTA TCGTTGAAGT CATGGGAGGA ATTGAACCAA IBO 

CTGTAGATTG GTTAAGAACA GCACTTAAAA ATAAAAAACA TGTTATTACC GCAAATAAAG 240 

ATTTATTAGC AGTACATCTT AAACTTTTAG AAGATTTAGC AGAAGAAAAT GGTGTAGCTT 300 

10 

TAAAGTTTGA AGCGAGTGTA GCAGGTGGTA TTCCGATCGT AAATGCCATA AATAATGGTT 360 

TGAATGCGAA TAATATTTCA AAATTTATGG GAATTTTAAA TGGTACCTCT AATTTTATTT 420 

TATCTAAAAT GACTAAAGAG CAAACGACAT TTGAGGAAGC ACTTGATGAA GCGAAAAGAC 480 

75 

TTGGTTTTGC TGAAGCGGAT CCAACTGATG ATGTAGAAGG GGTAGATGCA GCGCGTAAAG 540 

TTGTCATTAC ATCATATTTA TCATTTAACC AAGTCATTAA ATTAAACGAC GTTAAACGAA 600 

2^ GAGGAATTAG TGGCGTAACT TTAACTGATA TTAATGTAGC CGATCAACTG GGGTATAAAA 660 

TTAAATTGAT TGGTAAGGGA ATATAXGAAA ATGGCAAAGT TAATGCATCG GTAGAACCAA 720 

CGTTAATTGA TAAAAAGCAT CAATTAGCAG CTGTAGAGGA TGAATATAAC GCGATTTATG 780 

25 TTATTGGTGA TGCCGTTGGT GACACGATGT TTTATGGAAA AGGAGCAGGC AGTTTAGCAA 840 

CAGGTAGTGC CGTTGTCAGT GATTTATTGA ATGTAGCATT ATTCTTTGAA TCAGATTTAC 500 

ACACATTGCC ACCACATTTT GAATTAAAGA CAGATAAAAC ACGGGAAATG ATGGATTCAG 960 

ATGCAGAAAT TAATATTAAA GAAAAATCCA ATTTCTTTGT AGTAGTGAAT CATGTCAAAG 1020 

GTTCAATTGA AAATTTTGAA AATGAGTTAA AGGCAATATT ACCATTTCAC CGATCATTAA 1080 

GAGTTGCAAA TTACGATAAT CAATCATATG CCGCTGTTAT AGTTGGATTG GAATCATCAC 1140 

35 

CGGAAGAATT AATCACTAAG CATGGATACG AATTGACAAA GTATACCCAG TAGAAGGAGT 1200 

TTAATTAXAA TGAGAAGATG GCAAGGATTA GTAGAAGAGT TTAAAGCACA TTTACCAGTA 1260 

AATGAAA^TA CACCAAAATT AACATTGAAC GAGGGAAATA CACCACTCAT TCATTGTGAA 1320 

40 

AATATGTCTA AAATACTAGG CATAGATTTA TATGTGaAGT ATGAAGGTGC CAATCCGACA 1380 

GTTCATTTAA AGATCGCGGT ATGGTAATGG CTGTGACAAA AGCAAAAGAG CAAGGTAAGA 1440 

^5 AAATTGTAAT ATGCGCTTCG ACTGGAAATA CATCAGCGTC TGCAGCAGCA TATGCAGCGA 1500 

GAGCAGGTTT AAAAGCTATC GTCGTAATAC CAGAAGGTAA AATTGCATTA GGTAAATTGT 1560 

CGCAAGCAGT AATGTATGGT GCAGAAATCG TTTCTATTGA AGGAAACTTT GATGAAGCTT 1620 

50 TAGAAATTGT AAAAGAAATT GCAAAAAGTG GCGAAATCGA GCTTGTAAAC TCTGTCAATC 1680 

CATTTAGAAT CGAAGGACAA AAGACAGGCT CATTTGAAAT TGTACAACAA TTAGACGGTG 1740 
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AAGGCTTTAA AGAATATCAT GAAGCTAAAG GATCACAATT GCCGAAAATG TTTGGCTTCC 1860 

AAGCTGAAGG CGCATCACCA ATTGTTCAAA ATAAAGTCAT TAAAAATCCT GAAACGATTG 1920 

CAACTGCTAT TCX5AATTGGT AATCCTGCTA GTTGGGATAA GGCGACTAAT GCTCTTAAAG 1980 

AATCAAATGG ATTAATAGAT AGTGTTACTG ATGATGAAAT TCTAGAAGCA TATCAGTTAA 2040 

TGACAACTAA AGAAGGTGTC TTTAGTGAAC CAGCGAGTAA TGCTTCTATT GCAGGTTTAA 2100 

TTAAATTGCA TAGACAAGGT AAATTACCTC AAGGTAAAAA AGTAGTTGCT ATTTTAACTG 2160 

GTAATGGATT AAAAGATCCT GATACTGCTA TTTCACTACT AGATAATCCG ATAAAGCCAT 2220 

TGCCAAATGA TAAAGATAGC ATTATCGATT ATATTAAAGG AGCTTTATAA CATGTCGAAT 2280 

GTTTTGGAGT TAACAATTCC TGCATCAACA GCCAACCTTG GAGTTGGCTT TGATTCTATA 2340 

GGTATGGCTT TAGATAAATT TTTGCATCTG TCTGTAAAGG AAACATCAGG GACAAAATGG 2400 

20 GAATATATTT TCCATGATGA TGCATCTAAG CAATTGCCTA CTGACGAAAC AAACTTTATT 2460 

TATCATGTAG CACAACAAGT TGCTTCTAAA TATAGTGTTG ACTTGCCTAA TTTATGTATC 2520 

GAAATGAGAA GTGATATTCC ATTGGCAAGA GGGTTAGGTT CXjTCAGCTTC TGCTTTAGTA 2580 

25 GGAGCTATAT ATATCGCAAA TTATTTTGGT GATATCCAAC TGTCTAAACA TGAGGTATTA 2640 

CAATTAGCGA CTGAAATCGA AGGACATCCT GATAATGTTG CGCCGACCAT TTATGGTGGT 2700 

TTAATCGCTG GATATTATAA TGATGTCTCG AAAGAAACGT CaGTtGCACA TATCGACATA 27 60 

CCAGACGTGG ATGTGATTGT AACGATACCA ACTTATGAAC TAAAAACAGA AGCATCAAGA 2820 

CGTGCTTTAC CACAAAAATT AACACATAGT GAAGCGGTTA AAAGTAGTGC AATTAGTAAT 2880 

ACAATGATTT tGgCATTAGC ACAGCACAAT TATGAATTAG CAGGTAAACT CATGCAACAA 2940 

GATGGCTTTC ATGAACCGTA TCGTCAGCAT TTAATTGCTG AATTTGATGA AGTGAAAACA 3000 

ATTGCTAGTC AACATAATGC CTATGCAACT GTAATTAGTG GTGCTGGACC AACTATTTTA 3060 

ATATTTAGTC GTAAAGAAAA TAGTGGGGAA TTGGTTCGCT CTTTAAATAG TCAGGTAGTA 3120 

TCATGCCATT CTGAA 3135 
(2) INFORiMATION FOR SEQ ID NO: 462: 
45 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 120 9 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDSDNESS : double 

(D) TOPOLOGY: linear 

so 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 462: 
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AGnTCAATAT TTAGATCAAG CCGTTTTAAG TAATTACGAA CAAGTTTATA TCATTCATGG 120 

TAAAGGTACA GGTGCACTTC AAAAAGGTGT ACAACAACAT TTGAAAAAGC ATAAAAGTGT 180 

TAGTGACTTT AGAGGTGGTA TGCCAAGCGA AGGTGGATTT GGCGTTACCG TTGCAACACT 240 

AAAATAAATT ATAATTTGAT AAATTAAATA GCTGCAGTTA AAATAATGTA AAGCAACAAG 300 

AATACATTTC AAACATGTTA TTTGAAATAA GCATAAAAAT TGAGCAAATA GAAATACATG 360 

AAGCATGTTA TCTGATATAA TTTGAACATC ATAATAATAA TTAAGGAGGA TTGGCATTTA 420 

TGGCAATCGT AAAAGTAACA GATGCAGATT TTGATTCAAA AGTAGAATCT GGTGTACAAC 480 

TAGTAGATTT TTGGGCAACA TGGTGTGGTC CATGTAAAAT GATCGCTCCG GTATTAGAAG 540 

AATTAGCAGC TGACTATGAA GGTAAAGCTG ACATTTTAAA ATTAGATGTT GATGAAAATC 600 

CATCAACTGC AGCTAAATAT GAAGTGATGA GTATTCCAAC ATTAATCGTC TTTAAAGACG 660 

GTCAACCAGT TGATAAAGTT . GTTGGTTTCC AACCAAAAGA AAACTTAGCT GAAGTTTTAG 720 

ATAAACATTT ATAAGTTACA ACCAATGACG ACTGGGGCAT TTCTTTAATG AATTGCTCCA 780 

GTTTTTGTTT GTGTTTTTAA TATAAAAAGT TGAATGATAA GTCATCATAT TGTTTACGAC 840 

25 TTGAGAATGG TGGGATTAAT AAATCTATGA ACGTTAAATG ATAATCTAGC ATGCTGATAG 900 

ATTTGTAGCA GTTGGTTTGA TAAAACCATG TTCAATATTA CATGATGXGC ATGAAAAGTC 960 

ATACTCGAAG ATGTTGATTA TTAACTAGAA TTAGTGGTGA TA7VATTTGAA GCACTTTTGT 1020 

AGCATCATTC ATTTTAAAAT TAGAAGGGGG GATATTTTTG GAAGACTATA AGCAACGAAT 1080 

TAAAAATAAA TTAAATGTCG TACCTATGGA ACCAGGATGC TATTTAATGA AAGATCGTAA 1140 

TGATCAAGTG ATATATGTTG GCAAAGCTAA AAAGCTAAGA AATCGATTGC GATCATATTT 1200 

TCACXkSGTG 1209 
(2) INFORMATION FOR SBQ ID NO: 463: 



20 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2410 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 463: 

AGTTCAACAC GACGAATTTT ACCTGAGTTT GTTTTTGGTA AGTCGTCAAC GAATTCAATC 60 

so TCTCTCGGAT ATTTATATGG TGCAACTTCA TTTTTAACAA ATTGTTGTAG TTCTTTAACT 120 

AACGTATCAT CACCCGCAGT ATGGTCCTGT AAAATAACGA ATGCTTTAAC AATATTTCCT 180 
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10 



15 



GCATCTTCAA CTTCAAAAGG CCCAATCGTA TAGCCTGAAC TAATAATAAT GTCATCTCGA 300 

CGTCCTTCAA ACCAGAAATA ACCATCATCA TCTACATGAG CTAAGTCACC AGTGATGTAG 360 

TATTtACCTG TTTGCGCTTT CGCCGTACGT tCTGGCTCTT tATAATACCC TTTGAAAAGT 420 

GCTGGCAAAT CAAGTGGTAC TGCAATATTC CCTTTCGTAT TAGCAGGTAC GCTATTCCCC 4 80 

TCATCATCTA CTACAGTGAC CGAACTACCC GGAATGCCTT TACCCATTGA TCCAATCCTC 540 

TGTGGTGTAT CTTTTAAAAA GCCTATAAGC AAGGTACTTT CAGTCTGGCC ATATCCATCT 600 

CTTACAGTTA AATTAAAGTA TTTCTTGAAT TGTTCAACTA CTTCTCGATT TAGTGGCTCA 660 

CCTGCAGAAA CGGCACTATG TAAATGCGTT AAGTCATAAT CATTTAAGTT CTGTAATTTA 720 

GCCATCATAC GATATTCTGT CGGTGTACAA CATAAAACAT TAATTTGATA TTTTTGAAGC 780 

AATTCTAAGT ATGTTTCAGG ACTGAACCTT CCATTAAATA CAAAAGCAGT TGCACCTGAA 840 

20 CCTAATACAG ATAAGAAAGG ACTCCATACC CATTTTTGCC AACCTGGTGc TGCTGTTGCC 900 

CAAACTAAGT CATCTTCATT aATACATaAC CAATGTTTTG GTGCCATTTG TaAATGTGcA 960 

AATCCCCaTC CATGACAATG TGTAACGGCT TTAGGATTGC CAGTTGTACC AGATGTATAT 1020 

25 QACAGAATCG CCATATCATC ACGCGTCGTA TCTGCCATTT CTAGTTTGTT ACTTGCGTTT 10 80 

TCTTTTTCAG CTTCAAGTGA AATCCATCCA TCTTTTTGAC CGGCAATAAC AAATTTAGTT 1140 

AACGCATCAT ATTCTTTAAT TTTTTCAAAT TCAACTGTGA ATGGCTCTAG TGCAATAACT 1200 

GCATTAATTT CACCATGTGT GATACGGTAT TGTAAATCTT TAGTTCTTAG CATTTCAGAA 1260 

CATGGAATGA TTGCAACACC TAATTTTAAA GCAGCAATAT ATAATTCATA CGTCGCAATA 1320 

GATCGTGGCA TCATAATGAG TACTTTATCG CCTTTAGATA AACCGTGCGA TGCTAAAACA 1380 

TTACCTACTT TATTAGACTG TTCAATGAGC TGTTGGTAAG TGACTGATAT ATCTTCGCCT 1440 

TCAGTATTAT GATATAAAAT TGCCTTTTTA TCTGGTATGT GGCTATATTT TTCGATTTCC 1500 

GAAATAATGT TATATTTTTC AGGCGCGAAT AGAGCTGACT TTTGCATAAC TAACTTCCTT 1560 

TCATACATCC ACTTTTCCTG TGATGAACAT TGTAATTTTA TAAATGAATT ATATACATCA 1620 

TACGCCTATC TTTACAGAAT TTTCAATTAA ATAGGGTTAA ATACCAAAGT CCTCGACACT 1680 

4S ACACTTTGAC ATGACGTAGC ATTCAAGGAC TTTCAAATGA TTGAGGGTTG ATATCTCGGG 1740 

CTAGACCATA TCAGCTAATT CAATACGAAT ATTGTATGAT AATTCACGAT TAATTATTTT 1800 

TACATCTGCA CCTTTCGAAG TGCCACGATG CTTGTGTGTA TGCTTGTACT CAGCTGAATT 1860 

SO TTGCCAATGA TAAAATGCTT GCCTATTTTC CCACAGCGTA ATAATGATAT AGTGTCTACC 1920 

AGCTGTTCTA GGTCTTAAAA ACCTTAATGC TTTAAATCCA TCAACGTTTT TTAAATGCTT 1980 



30 



35 



40 



55 



1380 



EP 0 786 519 A2 

ATTTAACACA CATAATGAAT CATTTGATAA ATCATTTATC GCTTCTAGCA CATCGTAATA 
TGCAGTGTCA TTATTTTTTT GTATTGTGAG ACAATCATCC AGTTCTTCTA TTACATAACT 
TCTATATTCA TCATAAATTT TCATAATAAA TGCCTTCATT TCATTTATAT TTTTGGTCAT 
ATTACTkTAT ATCTATTACT AAtkCATTCC CGTATTTATT AATTACAATC ATAGTTTGGC 
TyCTTTTTAA AAGATAAGAC TTTGTAAAAA GTATTAATAT TTCATGCAAA TGGGGGACAG 
GAGTCGCCCA CTATTTTTGT GTCTTCAATT TCATGATCAT TATTTAACAT TAGTCATGAA 
AATAGCCGAC 

(2) INFORMATION FOR SEQ ID NO: 464: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 590 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 464: 
TTTATTAATT GTAAAAAATT GAGTAAATTA TCTTTACATT CTAAATTAGT CTTAACTACA 
ACTAGTATCC TAATAATTAT AGGAGCTATT ACATTCTTTT TATTAGAACA GTTTAATACT 
ATGCAACATA TGGGACTAGT TGAAAAAATC GGAAATTCTT TTTTCCAATC AGTAACAACA 
CGAACAGCGG GTTTTAACAG TATAGATATA GCAAGCATTA rCAAATCTAC CGCATtAaTG 
TTAATGCTAC TTATGTTTAT TGGTGGTGCC CCTCTCAGTG CAGCTGGAGG AATTAAAATA 
ACTACTTTTG CAGTTGCGTT TATTTTTGTA CTAAATTATA kACGTAAAGA AAATAATGTT 
TCAGTATTCA ATAAAGAAAT ATCTGACAAA CATATAAAAC TATCTATTGT TACCATTAAT 
ATCTCATTTC TATTTATCAG CATCATTACT TTTATATTAT CGATAATTAA TCCGAACATA 
TCATTAATCA AGTTATTATT CGAAGTGGTT TCTGCATTCG GAACAGTAGG GTTAAGTATG 
AACCTTACCA CAGAATATCA TGGTATTACT AAAATAATTA TTATATTCGT 
(2) INFORMATION FOR SEQ ID NO: 465: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 905 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNSSS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 465: 
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TATTCGATTT GAnTCTTTTA AAATTATGTT TAAAAACATG TCTAATGATT CCGCATCATT 120 

TTTTGCACCA TCAATAAGCG TTTCAGcAAA CCCCTTAATT GAAGTAATAG GTGTTTTTAA 130 

TTCATGTGAA ACATTTGCTA CAAATTCACG TCTTAGATTT TCAAGTTGTT TCAGATTTGT 240 

TATATCATGC ATCACaACTA AAATCCCtTG CAAACTTTTT TGAGACCTAG TTAAAATCGG 300 

AACGCATGAA ATATCAAAGT ACTTGGCATG GACTTGGTTT ATT6CAACTT CCAATTGTTC 360 

ATAAATAGGT TTTTCAACTT TAAAACTTTC TAAAATTAAT TGCTCAATTT CAGTATTAAC 420 

ATAGCCGTGA TAGCCTACTT GTTCAATATT ATGCGAGATG TTGAACTGTT CATAATACGC 480 

TTTATTTGCA ACAACGATTT TTCCATTTCG ATCTATCATT AAAATAGCAC TTGGAATATT 540 

TTCAATCGTT GTTTTTAAAC GGTTGGATTG AATTTTTTGC TCATTATTAA GCTTTTGAAG $00 

GCGTCGTGCT AAATCATTGG TAGACACAAA AAGCGCTTTA GTTTCTACAA CATTACTTTC 660 

AGGTACACGT ATGTGATAAT AACCATTTGC CAACAATTGT GTTGCATAAG TAACTTCTTG 720 

AATGGGACGG ATTAATGTAC GCTTAAAACT ACGGCTTGCA AAATACAGAC AAATGAGTAC 780 

AACTAAACAT GTCAAAATAA GATATTTCCA CAACGTCCAA TGCATTTCTG TAATATCGTT 840 

25 ATTGTAACCT TTAATCCATA CATGATAACC GTTAACCrTC TTATtAAAAA TAAAAACGTC 900 

CCTTT 905 
(2) INFORMATION FOR S5Q ID NO: 466: 

30 (i) S3QUENCE CHARACTERISTICS: 

(A) LENGTH; 1016 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

35 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 466: 

TTTGGTTAGC CCATAAAAGA AAAAAACAAG TAGTCATTTT TAAACAACAT ATCAAGTCTA 60 

CCCAAGAAAT ACGTTTTGAC AAAGCGAAAG TGCTTGAACA CAAAGATGAA ATAGCAAATT 120 

TTATTTCTTT CGAACCACAA AGTTTTGAAT TTTATTATTT TACAGAATCG GAATTTTCAG 180 

AAGAACAATT AAATGAAGTT TCGCCAATTA GAATTAAATT CAATGTTATA AGACACACAA 240 

AAGATTTGaT AAAGCATATG CCGAATATAT TTTTGGcTAG ACTTATTTCA GAAGATAATG 300 

ATAAAAAGAC ATATATGTTC TATAAACGCA AAGTATTAAC CGATAACTTT TTAGATAAAT 360 

so ATATGCAGAA ATTTTCACCG GCAACATACA CAATAATATT TGTAAATGTC TTAATATGGT 420 

TATGTATGAT TTTATATTTA AATAATTTTT CGGATGTAAA ATTATTAGAT GTTGGCGGGT 480 
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ATTTTAGTTT TGAACATATA CTTATGAATA TGCTTTCATT ATTTATTTTT GGTAAAATAG 
TCGAAGCAAT TATTGGTTCA TGGCGGATGT TAACTGTATA CTTTATTGCA GGGTTGTTTG 
GAAACTTTGT ATCACTATCA TTTAATACGA CTACAATTTC AGTTOGGGCT AGTGGTGCTA 
TATTTGGTCT GATTGGATCA ATTTTTGCGA TGATGTATGT TTCAAAAACA TTTAACAAAA 
AAATGTTAGG ACAGTTATTA ATTGCATTAG TGATATTAGT TGGTGTTTCT CTGTTTATGT 
CAAATATAAA TATTGTGGCG CATATTGGAG GATTCATTGG TGGTTTATTA ATAACTTTAA 
rrGGCTATTA CTATAAAGTG AATCGCAATA TTTTTTGGaT TTaCtAATTG GTATGCtTGt 
tATATTTAwT GCACyTCmAA TTAgAtTTTT ACmATTAAAG AAGATAATAw TTATAA 
(2) INFORMATION FOR SEQ ID NO: 467: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 406 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : doxible 

(D) TOPOLOGY: linear 

• (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 457: 
AACTTTAAAT TTAGACATCT TTAAAACCTC TCTTAAACCA TGCCTATATC TCAAGATGAT 
ATTTCAAATG AACAATACTA TTGCTTGAGA CCATTAATGA ATGATCATAA ATATTTCTTT 
CTATAAAATT AGCTTTCCAA TAACTGTGTT GTTGCATAAT ATCATTCACA AGTACACCAT 
TTTCGGAAGT ATGATTATCT TTATCTATAC TTAAAACAAT TTGTTTAGTT TTAGCATGGC 
TAAATTGTTG AAGACCCTTA CACGATAAAC GTATAGCGTC TGAATTCTCA TTTAACAATG 
CGGCTGGgCA AACAAATGAC ACATTGTACT TCATGTTTGA ACtTCGTTAC AATCaTCGTG 
kCatTTTGat AAATAACAAT CCCTCGTAAT kGATTAAGTA TATTAT 
(2) INFORMATION FOR SEQ ID NO: 468: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 137B base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

(xi> SEQUENCE DESCRIPTION: SEQ ID NO: 468: 
AGATAATACA CTTGAAGTTG GAATGGTTTG TGACGGTTAT TTAATGCGAA TTGAAAACTT 
AACACCATCA AATTTCTTCA ACTCAGCAAG TGAAGATACG ATTACTAAAA TTAAATTAAA 
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AGGTACAGCG TTAAAACTAA GAGAAGCCAT CAATTATGAT GAAATGGTTA TTGTAGATAG 240 

TATGACGTAG TTCCTAATTA TGCkAAAAGG GATTGATGAA AAACTGAAGG GCTTTTCATC 300 

AATCCCTTTT ATTTTAGGGG AATTGAATAG ATAGTTTTAA ACTATACGAA TTATTAATAT 360 

TTGAGATTTA ATTGAAATAA GTTTTAAAAA TTGGAGGAGA TAGATTAAGC GAAGTCATTT 420 

AAAGGTGAAG TTAAGTGTAT TCACAAAAAxi TAGCCACACT CATATGACAT CGGATGAGTG 460 

TGGCTTAAGG ATCTATGGGG GGAGGAAnCC ATAGATGTTT ACTTTGATAG GCCAGATTAA 540 

ATATCAAAGT ATGCGATTAT TTATAGCTTG ATGCAAAAGT GGTATGCCTA TTAAAAGTTA 600 

CTGCACATAG CTTTTAATAT TCCGTTCAAA GGAAAGGGGC ATACAATTGA ACAATCTGTA 660 

IS 

\TK3iikxnrnrii^ca^ 'csac35crrrcrr "ccAi^rcKOcr tio — 

^GAACCTCT AACTTCGTTA GTACGATTAA GAAAAGCTTT TTAGTTAGTA TGTAATACAA 780 

CTTATTGACG CGCGTGAATC TCTTTTATAA GAGTGTGTAG GGAATGGCGT TGTATAAATT 840 

3TATTAGAAG AACTTCTAAC GCATCTCTGT GGTTAAAAGA GATGAAGGGA ACGACAGTTT 900 

lATTAAAACT GCATAAGAAC TTCTAGCTTT TCTCTCTCGT TCAAAGAGAA GCAGcTGTTC 960 

SCAGTTTAAT CAAAACCACA TAAAGCTTTT AACTTTACTC TTTGATTTAA AGAGTGATAA 1020 25 

\TGTTTACAG TTTAATTAAA ACTGCATAAG AACTTCTAGC TTTTCTCTTT CGTTCAAgAG 1080 

\AGCAGCTGT TCGCAgTTTA ATCAAAACCA CATAAAGCTT TTAACTTTAC TCTTTGATTT 1140 

^AAGAGTGAC AAATGTTTAC AGTTTAATTA AAACTGCATA AGAACTTCTA GCTTTTCTCT 1200 

rXCGXTCAAA GAGAAGTTCT AATACCACCA TATCGTGCGA TCGGGAACGG TATATATATT 1260 

XATAGGAGGG TAATATATAT TTAACGCACG ATATGGGACT ATTAGCCTTC GACTTTGTTA 1320 

rGTTGATGTG TGGCCTAAAA TATTGGAGAT ACCAATATTT TAGGTTGCAT CAACATCA 1378 
(2) INFORMATION rOR SEQ ID NO: 469: 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4171 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 469: 

rCCCAACCAA TAATCGTGGC AAAAATACGG ATATTGGTAT GGCTTAACAA ATTGCAAATA 60 

rCGTTTAATC ATACATCCCC CCTAATCTAT TGCCCTATCC TATTCaTAAG CATAAAAATG 120 50 

U^TAGAGGTT GGATACATAA TTTGTAGATG TAAATTCTTC TTACAATTTA CATTTTTAAA 180 



55 



1384 



EP0 786 519 A2 



10 



IS 



20 



25 



30 



35 



40 



45 



SO 



TTATATTCTA TTCAATTTAA TCTATGGATA CTGTGTCCCC ACACGACAGC AAAAGTTATC 
ATACTTCTTT ACATCACTAA GTCAATATAA ATGATTTAAT CAGTATTTAC ACTTTATTTG 
CTTAATACTG TCTAATTTTT TTGTAACGTT CTTTCCAAAC TTTGATAAAA TCTGGCGCGA 
ATGGGCCCTT CTTCTGTTCT ATCCATTGTT GAAGAATGTC CACGTTGCGT CTTAAAATAA 
TATCAATATC ATGCGGATAA TTCATTTGAT TCATATGTTG CTCATATTCA TCTTCATCTA 
ATAAATGATA CTTTCCGTTT GGATATACTT TAATATCTAA ATCATAGTCT ATATATTTTA 
ATGCCTCTTC ATCACAAACA AATGGTGATG ACAAATTGCA ATAGTAATAA ATTCCATCTT 
CrCTAAACAT GCAGATAACA TTaAACCAAT ATTCTGAGTG AAAGTaAACA ATTGCCGGTT 
CACGTGTTAT CCAAGTTCTT CCGTCACTTT CAGTCACTAA CGTATGATCA TTTCCACCAA 
TGACAACATG ATCAGTACCC TTTAATATTG TTGTTTCAGA CCAAACGCGA TGAATCTTAC 
CATCATGTTT ATAACTCTGA ATTTTAATGT TTTCCCCTTC TTTAGGTATG GATTCTCTGA 
CCATACTCCA CACCACCTTC TGTTAATTTA ACCATTATAA ATTATAGCAT ATTTCAGAAA 
TAGTATTATA TAAATACATA TTTTTACGAA ATAAGATTTT ACTACTTAAT AATTAAACTC 
GGTAATATTG CTAAGTACTA CAACAGAGAT TTACATGTCC CATTTAAAGT ATATAAAATC 
ATCACTTTTA TATATCAACA CTTTAACTTT TTGACATTGT TATTCTATGA GATTTAAAGA 
TATCATTTAT ACTTTTTAAA ATTAATGTCA CTATGTTTTC CGATAATATT ACCAATCATC 
GAATGTTACC CATTTATAAA TTGATAAATs TTTGACATAG GTACAGGGAA TGTATATTGA 
TCrCGATCAC TTAAATCAAA CCAAATCATG TCATCTGGTA ATGTTTCAAT GTTAATTGCT 
CCTGAAACGG CGTATACTTT AATCTTCCAT GTTAAATGAG TAAATTGATG CTTCAACTCA 
AAAATAGGTG TTTCTACTGG TTGAATGTCA TGACCGATTT TTTCAGTCAT TTTACGTCTA 
GCATGCTCAC TTTCAAACAT AGGAAATTGC CACATACCAT GCAATAATTT TTCGCTACGC 
TTTTGCAACA GATATTGACC TTGATTATTT CTAATTAAAA AGACGGATTG CTCAATTACT 
rmTACTTA CATTTTTAGA TTTAACAGGT AACTTTTCAA ATGTACCTTT ATCAAATGCC 
TCACAGTTTT CTTGAACTGG ACAAAATAAG CATAATGGAT TTTTTGGTGT ACAAATTAAC 
GCCCCTAATT CCATCATAGC TTGATTAAAC GTTCCAGCTT CTGTAGTAAC ATACGGTAAT 
AATTCTTGTT CGTACGATTT CCTCGTCGAT TGTAATTTAA TATCTCGATA GTCATCATTC 
AATCTAGACC ATACTCGAAA AACATTTCCG TCTACAGTTG CTAGTGGTAC ATTATATGCA 
ATGCTCATTA CTGCAGCTTG TGTGTATGGG CCAACACCTT TTAACGCTTT AAATTGATCA 
GGATCTTTGG GAACTAAGCC TTCATATTTA TCATGAACTT CTTTAATCGC CGTATGAAAA 
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GCTTGaCTCA AAACTTCCAC AGTTGGAAAT CGTTCAACAA AACGATGATA ATAGTCAATA 
ACTGTTTTAA CTTGTGTCTG TTGTAACATG ACCTCACTTA ACCAAATATA GTACGGATTG 
GTCGTTTGTC GCCATGGCAT TTCTCTTTGA TTTTCATCAA ACCAGTGTAT CAAATTTTCT 
TTAAAACTAG ACTGCTGATA CATTTATAAA ACCCTTTCCT CACCAAAATT AATTGTCTTT 
ACTCATAATG TTTTTATTGT ACATTAAAAT CATGGTTAGT ATGTAAGTTA ATTTAGTTAT 
TTGCGAAATT GGATTATAAT AGTATATATA ATATTATGAA ATGAGTGAAC TGATATGGAC 
ACTGCAACAC ATATCGCAAT TGGGGTGGGC CTTACAGCAC TTGCAACTCA AGATCCAGCA 
ATGGCTTCTA CGTTTGGTGC AACAGCTACA ACCCTTATCG TTGGTTCATT AATTCCTGAT 
GGGGATACTG TTCTTAAATT AAAGGACAAT GCAACATATA TTTCGCATCA TAGAGGTATC 
ACGCATTCCA TCCCTTTCAC AATACTATGG CCAATTTTAA TTACATTTTT AATATTCACG 
TTCTTTAGTG GAACCAACCC ATTTCATGTA TGGATGTGGG CTCAGCTCGC AGTATTTTTA 
CATGTCTTTG TAGATATATT CAATTCTTAT GGTACACAAG CGCTTAGACC TATCACAAAC 
AAATGGATTC AATTAAGTGT GATTAACACA TTTGACCCTA TTATTTTCAC AGTTCTTTGT 
ATTGGTATTG TATTATGGGT TATAGGCTTG CATCCATTTG CAGTCTTCTT TCCTATAATC 
GCTTTACTAA TCATTTATTA CATGATTCGT TTTAAAATGA GAGCCGTAAT TAAGCAACAA 
GCTTTAAAAG CAATTCAACA AGAGCATCAC CCTGTTAAAG TATTTGTTGC GCCAACAATA 
AAATTTATGG AATGGCGTGT CGCGATACAA ACTGATGCAC ATGACTATGT TGGAAAAGCA 
TATGGTAGGA ATGTGGTGTT TAGTGATAAA GTGGAACGTC AAACATTATC AACAGACTCC 
ATTTTATGGA AAGTCAAAGG TAATAAAGAT ATACGTACTT TTTTAAACTT TTCATCAATC 
TATCGTTGGC AAACAACAAC GTTAGCAGAT GGTTCTACTG AAATTCGTIT GATTGATTTG 
CGTTATTTAA AAAATGATCA TTATTCATTT GTGGCAATTG CACATGTAAC AAAOGATAAT 
GTCATAGACC ACTCTTATAT TGGCTGGGTA TTTACAGAAG ATAAGTTACA ACGTAAACTG 
TATGCTAAAT AATTTCAAGT TATTATTCAC TAAAGTTAAT CTATAAAAAA TGAACAACCG 
GGCAGAATGA AAATCAAAAC GATTTTTACT CTGTCCGGTT TTTTAATGTA AAACTATGAA 
TGCTTTTACA AAATCTAAAA TTTATATTGT TGCTAACAAA CTACCTTTAA TGACTCGAAA 
TATCAAAATC AGTATAGGAA AACAATATCT AGATGATATT CTAATTGTTT CTGATTCTCA 
CAGATTAATT TACACAACAG GTCAGCTAAA CATCATGAAG AAGTATCCGC CTCGTCTGTA 
CTATCATTTG AAACATCCTG TTGATTATCa GTTTGTGTCA CTTTAGATGT TTTATTaTAA 
ATTGCGTGTG TCGTATACCT TGCTAATACG AAATTTACTG CAGCTATTAA ACATAAGAAT 
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TGTGCTATAC CATTAACAAT GTAATACATT GGATTTAGCA TTAGGATGTG ATTGATAAAT 3 900 

ACATGATTTG GATTTGGTAT GAAAATAATT GGTAACAATA AGAAACACAA TACACAAACC 3960 

^ CCATAAAATA TGATATTTAT TTTTTCAGwT AACAGTCGAA TAAGACCAAA AGTAACGGAT 4020 

ATTAATCCTA CAAAAATAGT TGCCATCACA ATAAAATAGA ATAGCGCTAT ATATGATGTT 4080 

TCGAAGTTTA CTGGTTTAAC CAATGCACTA ATCATCGTCA AAATGACTAG CATAATAAAA 4140 

TO 

CTTAAAATAG ACATAATAAC TACTGGCGTC G 4171 
C2) INFORMATION FOR SEQ ID NO: 470: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 9821 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

20 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 470: 

TGGTTGAAGT AGCAGTTAAT TCAAAATCTG CAACAGTTTC AGCAGAATaG GGGCTTTCAA 60 

25 AATAAtCAAA GGAGAATAAT TTATGACTAA AACTTTAAAG GTTTATAAAG GAGACGACGT 120 

CGTAGCTTCT GAACAAGGTG AAGGCAAAGT GTCAGTAACT TTATCTAATT TAGAAGCGGA IBO 

TACAACTTAT CCAAAAGGTA CTTACCAAGT GGCATGGGAA GAAAATGGTA AAGAATCTAG 240 

3^ TAAAGTTGAT GTACCTCAAT TCAAAACCAA TCCAATTCTA GTCTCAGGCG TATCATTTAC 300 

ACCAGAAACT AAATCAATTA TGGTAAATAC CGATGACAAT GTTGAGCCAA ACATTGCACC 360 

AAGCACAGCA ACGAATAAAA TATTGAAATA TACAAGTGAA CATCCAGAAT TTGTTACTGT 420 

35 

AGATGAAAAT ACAGGAGCAA TTCACGGTGT AGCTGAAGGT ACTTCACTAA TCACTGCTAC 480 

GTCTACTGAT GGAAGCGATA AGTCAGGACA AATTTCAGTG ACAGTAACAA ACGGATAGGG 540 

ATTTAAGGCG CAGTATATCT GCGTCTTTTT TATTTGAATA AAAGGAGCTA ATACAATGAT 600 

40 

TAAATTTGAA ATTAAAGATC GTAAAACAGO AAAAACAGAG AGCTATACAA AAGAAGATGT 660 

AACAATGGGC GAACAGAAAA ATGCTATGAG TATTTAGAAT TAGTAAATCA AGAGAATAAA 720 

AAAGAAGCAC CTAACGCAAC AAAAATGAGA CAAAAAGAGC GACAGTTATT AGTAGATTTA 780 

TTTAAAGATG AAGGATTGAC TGAAGAAGAT GTTCTGAACA AGATGAGTAC TAAAACTTAT 840 

ACAAAAGCCT TACAAGATAT ATTTCGAGAA ATCAATGGTG AAGATGAAGA AGATTCAGAA 900 

SO KCTGPJ^QQhQ AAGAGATGGG AAAGACAGAA GAACAATCTC AATAAAAGAC ATTTTATCGA 960 

ACATTAAGAA AATACAACGT TTCTGTATGG AGCAGTATGG GTGGACATTA ACTGAAGTCA 1020 

55 
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AAGAAAAACA AAGTGAACAA AAAGTCATTA CAGGTACGGA TTTAAGAAAA CTTTTTGGAA 1140 

GCTAGAAAGG AGGTTAATAT GAATGAAAAA GTAGAAGGCA TGACCTTGGA GCTGAAATTA 1200 

^ GACCATTTAG GTGTCCAAGA AGGCATGAAA GGTTTAAAGC GACAATTAGG TGTTGTTAAT 1260 

AGTGAAATGA AAGCTAATCT GTCAGCATTT GATAAGTCTG AAAAATCAAT GGAAAAATAT 1320 

CAGGCGAGAA TTAAGGGGTT AAATGATAGG CTTAAAGTTC AAAAAAAGAT GTATTCTCAA 1380 

10 

GTAGAAGATG AGCTTAAACA AGTTAACGCT AATTACCAAA AAGCTAAATC CAGTGTAAAA 1440 

GATGTTGAGA AAGCATATTT AAAGTTAGTA GAAGCCAATA AAAAAGAAAA ATTAGCTCTT 1500 

GATAAATCTA AAGAAGCCTT AAAATCATCG AATACAGAAC TTAAAAAAGC TGAAAATCAA 1560 

15 

TATAAACGTA CAAATCAACG TAAACAAGAT GCGTATCAAA AACTTAAACA GTTGAGAGAT 1620 

GCAGAACAAA AGCTTaAGAA TAGTAACCAA GCTACTACTG CACAACTAAA AAGAGCAAGT 1680 

20 GACGCrtACA GAAGCAGTCC GCTAAGCATA AAGCACTTGT TGAACAATAT AAACAAGAAG 1740 

GCAATCAAGT TCAAAAACTA AAAGTGCAAA ATGACAATCT TTCAAAATCA AATGATAAAA 1800 

TTGAAAGTTC TTACGCTAAA ACTAATACTA AATTAAAGCA AACAGAAAAA GAATTTAATG 1960 

25 ATTTAAACAA TACTATTAAG AATCATAGCG CTAATGTOGC AAAAGCTGAA ACAGCTGTTA 1920 

ATAAAGAAAA AGCTGCTTTA AATAATTTGG AGCGTTCAAT AGATAAAGCT TCATCCGAAA 1580 

TGAAGACTTT TAACAAAGAA CAAATGATAG CTCAAAGTCA TTTCGGTAAA CTTGCAAGTC 2040 

AAGCGGATGT CATGTCAAAG AAATTTAGTT CTATTGGAGA CAAAATGACT TCCCTGGGAC 2100 

GTACAATGAC GATGGGCGTA TCTACACCGA TTACTTTAGG TTTAGGTGCA GCATTAAAAA 2160 

CGAGTGCAGA CTTTGAAGGG CAAATGTCTC GAGTTGGAGC GATTGCACAA GCAAGCAGTA 2220 

35 

AAGACTTAAA AAGCATGTCT AATCAAGCGG TTGACTTAGG AGCTAAAACA AGTAAAAGTG 2280 

CTAACGaAGT TGCTAAAGGT ATGGAAGAAT TGGCAGCTTT AGGCTTTAAT GCCAAACAAA 2340 

CAATGGAGGC TATGCCAGGT GTTATCAGCG CAgcAGaAGC AAGTGGTGCA GAAATGGCTA 2400 

40 

CAACTGCAAC TGTAATGGCT TCAGCGATTA ACTCTTTCGG TTTAAAAGCA TCTGATGCAA 2460 

ATCATGTTGC TGATTTACTT GCGAGATCAG CAAATGATAG TGCTGCAGAT ATTCAATATA 2520 

TGGGAGATGC ATTAAAATAT GCAGGTACTC CAGCAAAAGC ATTAGGAGTT TCAATAGAGG 2580 

ACACTTCTGC AGCAATTGAA GTTTTATCTA ACTCAGGTTT AGAGGGGTCT CAAGCAGGTA 2640 

CTGCATTAAG AGCTTCGTTT ATTAGGCTAG CTAATCCAAG TAAAAGTACA GCTAAGGAAA 2700 

SO TGAAAAAATT AGGTATTCAT TTGTCTGATG CTAAAGGTGA GTTTGTTGGA ATGGGCGAAT 2760 

TGATTAGACA GTTCCAAGAT AACATGAAAG GCATGACGAG AGAACAAAAA TTAGCAACAG 2B20 
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CAGATAAAAT TAATAGCTAT AGCAAATCAT TGAAGAACTC TAATGGTGAA AGTAAAAAAG 294 0 

CAGCTGATTT GATGAAAGAT AACCTCAAAG GTGCTCTGGA ACAATTAGGT GGCGCTTTTG 3000 

AATCGTTAGC AATTGAAGTT GGTAAAGATT TAACGCCTAT GATTAGAGCA GGTGCGGAAG 3060 

GATTAACAAA ATTAGTTGAT GGATTTACAC ATCXTCCTGG TTGGGTTAGA AAGGCTTCGG 3120 

TAGGCTTAGC AATTTTTGGT GCATCTATTG GTCCTGCTGT TCTTGCTGGT GGCTTATTAA 3180 

TACGTGCAGT TGGGAGCGCG GCTAAAGGCT ATGCATCATT AAATAGACGC ATTGCTGAAA 3240 

ATACAATTCT TTCTAATACC AATTCAAAAG CAATGAAATC TTTAGGTCTT CAAACATTAT 3300 

TTCTTGGTTC TACAACAGGA AAAACGTCAA AAGGCTTTAA AGGATTAGCC GGAGCTATGT 3360 

TGTTTAATTT AAAACCTATA AATGTTTTGA AAAATTCTGC AAAGCTAGCA ATTTTACCGT 3420 

TCAAACTTTT GAAAAACGGT TTAGGATTAG CCGCAAAATC CTTATTTGCA GTAAGTGGAG 3480 

20 GCGCAAGATT TGCTGGTGTA GCCTTAAAGT TTTTAACAGG ACCTATAGGT GCTACAATAA 3540 

CTGCTATTAC AATTGCATAT AAAGTTTTTA AAACCGCATA TGATCGTGTG GAATGGTTCA 3600 

GAAACGGTAT TAACGGTTTA GGAGAAACTA TAAAGTTTTT TGGTGGCAAA ATTATTGGCG 3660 

25 GTGCTGTTAG GAAGCTAGGA GAGTTTAAAA ATTATCTTGG AAGTATAGGC AAAAGCTTCA 3720 

AAGAAAAGTT TTCAAAGGAT ATGAAAGATG GTTATAAATC TTTGAGTGAC GATGACCTTC 3780 

TGAAAGTAGG AGTCAACAAG TTTAAAGGAT TTATGCAAAC CATGGGCACA GCTTCTAAAA 3840 

AAGCATCTGA TACTGTAAAA GTGTTGGGGA AAGGTGTTTC AAAAGAAACA GAAAAAGCTT 3900 

TAGAAAAATA CGTACACTAT TCTGAAGAGA ACAACAGAAT CATGGAAAAA GTACGTTTAA 3960 

ACTCGGGTCA AATAACAGAA GACAAAGCAA AAAAACTTTT GAAAATTGAA GCGGATTTAT 4020 

CTAATAACCT TATAGCTGAA ATAGAAAAAA GAAATAAAAA GGAACTCGAA AAAACTCAAG 4080 

AACTTATTGA TAAGTATAGT GCATTCGATG AACAAGAAAA GCAAAACATT TTAACTAGAA 4140 

CTAAAGAAAA AAATGACTTG CGAATTAAAA AAGAGCAAGA ACTCAATCAG AAAATCAAAG 4200 

AATTGAAAGA AAAAGCTTTA AGTGATGGTC AGATTTCAGA AAATGAAAGA AAAGAAATTG 4260 

AAAAGCTTGA AAATGAAAGA CGTGACATCA CTGTTAAAGA ATTGAGTAAG ACTGAAAAAG 4320 

AGCAAGAGCXJ TATTTTAGTA AGAATGCAAA GAAACAGAAA TGCTTATTCA ATAGACGAAG 4380 

CGAGCAAAGC AATTAAAGAA GCAGAAAAAG CAAGAAAAGC AAGAAAAAAA GAAGTGGATA 4440 

AGCAGTATGA AGATGATGTC ATTGCTATAA AAAATAACGT CAACCTTTCT AAGTCTGAAA 4500 

SO AAGATAAATT GTTAGCTATT GCTGATCAAA GACATAAGGA TGAAGTAAGA AAGGCAAAAT 4 560 

CTAAAAAAGA TGCTGTAGTA GACGTTGTTA AAAAGCAAAA TAAAGATATT GATAAAGAAA 4620 
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GTTGGTGGTC TAACTTTAGA GAAGACCAAA 
AAGAAGAAAC AGCTCGTAGA AACAGAGAAA 
^ ACGGCGTAAA AACTAAAACT GGTGAAGCCT 

TTGGCGGCGA AATGAAAAAA ATGTGGAGTG 
CAAGTTGGAG CTCAGCCAAA AGTTCTGTAG 

10 

CTGGTAAATG GTTTGGAAAA GCTTGGCAAT 
ATCAAACTAA GCAAAAGTAT TCAGATGCCT 
TTTGGAGAGG CACATCAAAA TGGTTTAGCA 

15 

TAGATATGGC TAATAAATCG CGCTCGAAAT 
ATGCAAAATC CGTTTGGAAA GGAACATCGA 
AAGGTTGGAC TGGGGATATG TATTCAAGAG 

20 

CGGCATGGTC TAACGCTAAA TCAGTATTTA 
ATGATTGGAT TAGAGATATT GGTAAAGACA 

25 ATGTTGCTAA TAAAGCTATT GGCGGTTTGA 

CTAAAGCCAT TACTGATAAA AATCTCATCA 
TAGCAGGAAA GGGTGTAGCT ACCGATAATT 

30 TATTAAATGA TAGAGGTTCT GGAAACGCCC 

GGGCTGACGG AACATTCCAT GCACCCCAAG 
GAGATAGTGT AATAAATGCC AATGACACTC 
AATTCCATGG TGGTACGAAA AAGAAAAAAT 
AAAAAGCAGG GGACTTCGGT TCTAAAGCTA 
CAGAAGAAAT GGTTGAAGCG GCAGGCGATA 

40 

ATAAAATCGG CGATGTGTGG GATTATGTAC 
TGTCAGGTTT AAATATTAAT TTTGGAGGCG 
CGCGTACTCA TTGCTCAAAA AGAAATTAGT 

45 

TGGTGGCGGA GGCGATGGAA GCTATCTATT 
TTACACAGGT GGACTTAACT TTAATGGCGG 
SO TACAGGAACG AACATTTATG CTGTTAAAGG 

CGGTGGCGGT AATTCTATAC AAATTAAGAC 



AGAAGAAAAG TGATAAATAC GCTAAAGAAC 4740 

ATATAAAGAA ATGGTTTGGA AATGCTTGGG 4800 

TTAGTAAAAT GGGCAGAAAT GCTAATCATT 4860 

GAATCAAAGG AATTCCAAGC AAATTAAGTT 4920 

GATATCACAC TAAGGCTATA GCTAATAGTA 4980 

CTGTTAAATC GACTACAGGA AGTATTTACA 5040 

CAGATAAAGC TTGGGCGCAT TCAA/UVTCTA 5100 

ACGCATATAA AAGTGCAAAG GGTTGGCTAA 5160 

GGGATAATAT TTCTAGTACA GCATGGTCGA 5220 

AATGGTTTAG TAACTCATAC AAATCTTTAA 5280 

CCCACGATCG TTTTGATGCA ATTTCAAGTT 5340 

ATGGTTTTAG AAAATGGCTA TCAAAAACAT 5400 

TGGGAAGAGC TGCGGCTGAT TTAGGTAAAA 5460 

ATAGCAT6AT TGGCGGTATT AATAAAATAT 5520 

AGCCAATACC TACATTGTCT ACTGGTACTT 5580 

CAGGAGCATT AACGCAACCG ACATTTGCTG 5640 

CAGGTGGTGG AGTTCAAGAA ATAATTCACA 5700 

GACGAGATGT GGTTGTTCCA CTAGGAGTTG 5760 

TGAAGTTACA GCGGATGGGT GTTTTGCCAA 5820 

GGATGGAACA AGTTACTGAA AATCTTGGTA 5380 

AAAACACAGC TCATAATATC AAAAAAGGTG 5940 

AAATCAAAGA TGGTGCATCT TGGTTAGGCG 6000 

AACATCCAGG GAAACTAGTA AATAAAGTAA 6060 

GACTAACGCT ACAGTAAAAA TTGCTAAAGG 6120 

AGACAAAGTA AAATCGTGGT TTGAAGATTT 6180 

TGACCATCCA ATTTGGCAAA GGTTTGGGAG 6240 

TCGTCACTAT GGTATCGACT TTGGTATGCC 6300 

CGGTATAGCT GATAAAGTAT GGACTGATTA 6360 

CGGTGCTAAC GAATGGAACT GGTATATGCA 6420 
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ATCAGGTGCT ACAGGTAATT TCGTTAGAGG 
GTCGCATCCA GGGAATGATA CAGCTAAAGA 
^ TAGTGGCGTT CGAAGTGGTT CAGGTGTTAA 

ACGTCGTGCA GCAAAACGAA TGGGTGTTAA 
TAGCTTGATT CAACACGAAT CAGGAGGAAA 

70 

AGACATCAAC G TTT TA CAGG GCAATCCAGC 
ATTTAGACAT TATGCTGTTA GAGGTCACAA 
AGCGTTCTTT AACAACAGAT ATTGGCGCTC 
AAGTGG7CCA AGAAGATATG CGAATGGTGG 
GGGTGAAGGA GATAAACAGG AGATGGTTAT 

20 ATTAACTGAA CAGGTTATGC GCATCATCGG 
AAATAATGAT ACTTCTACAG TTGAAAAATT 
AGGAAATAAA TTAACAGATG CGTTGATTCA 

2S TTCTAATGAT GCAATTAGAG GTTTAGAAAA 

AAATGCAAAT AATTATATGG GAGGTTTGAC 
GATGGTTACA AGGAAGAAGT AATAACAGAT 

30 

GCTGAAAGTC CAAACACCAA TGATAACAGT 
CCGGGCGCAA TTAGTTTTGC GCCTTTTTCA 
GATGTTATAG ATTTAAATTT ATTTGAGCAT 

55 

CCTTATTATG TTATTACTTC TCAAATGCCT 
GTTACATCTA ATTTAAAAGA TGGTTCTTCA 
40 AAAGGGTATT CTGAATCAGT TAATTGGACC 
ATGTTTGAAA ATGGAATTCC TCTTGATTTC 
TTTACTATTT GGAACGGTTC TACTGATACG 
ATATTAATTA ATTTAAATGC GAGTGGAGGA 
ATTTTTAAGT ACAACAAAAG TATAGATAAA 
GCATATCGAG ATATAAACAG AGTGGGAATT 

SO 

CCAGGTAAAA ATGAATTTAA GATTaAAGGA 
TTTCCTTTTA TTTAXAGGTA GGTGATTTAA 

ft 

ss 



AGCACACTTA CATTTCCAAT TGATGCAAGG 6540 

TCCAGAAAAA TGGTTGAAGT CACTTAAAGG 6 600 

TAAGGCTGCA TCTGCTTGGG CAGGCGATAT 6660 

TGTTACTTCG GCTGACGTAG GAAATATCAT 6720 

TGCAGGTATA ACTCAATCTA GTTCGCTTAG 6780 

AAAAGGATTG CTTCAATATA TCCCACAAAC 6840 

CAATATATAT AGTGGTTACG ATCAGTTATT 6900 

ACAGTTTAAC CCAAGAGGTG GTTGGTCTCC 6960 

TTTGATTACA AAGCATCAAC TTGCTGAAGT 7020 

CCCTTTAACT AGACGTAAAC GAGCAATTCA 7080 

TATGGATGGC AAGCCAAATA ACATCACTGT 7140 

GTTGAAACAA ATTGTTATGT TAAGTGATAA 7200 

AACTGTTTCT TCTCAGGATA ATAACTTAGG 7260 

AATATTGTCA AAACAAAGTG GGCATAGAGC 7320 

TAATTAATGC AATCTTTTGT AAAAATCATA 7380 

TTTAATCAGC TTATATTTTT AGATGCAAGG 744 0 

GTAACTATTA ACGGAGTAGA TGGTATTTTA 7500 

TTAGTATTAA GGTTTGGCTA TGATGGTATA 7560 

TGGTTTAGAT CTGTGTTTAA TCGCAGACAT 7620 

GGTGTTAAAT ATGCAGTGAA TACAGCTAAT 7680 

ACTGAAATTG AAGTAAGTTT AAATGTTTAT 7740 

GATAGCGAGT TCTTATTCGA CTCTAATTGG 7800 

ACACCTAAAT ATACTCATAC ATCAAATCAA 7860 

ATAAATCCAC GATTCAAGCA CGATTTGAAA 7920 

TTTGAACTGG TTAATTATAC AACAGGTGAT 7980 

AACACTGATT TTGTTTTAGA TGGTGTGTAT 8040 

GATACAAATA GAGGCATTAT AACATTAGCG 8100 

GACGTCAGTG ATATTAAAAC TACATTTAAG 8160 

TGGATTATCA TGATCATTTA TCAGTAATGG 8220 
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ATTATGAACT GAATGAAGCT AGGTACATCA CCTTTACAGT TTATAGAACT ACTCATAATA 8340 

GTTTTGTTTT TGATTTATTG ATTTGTGAAA ACTTCATAAT TTATCATGOT GAAAAATACA 8400 

CAATTAAGCA GACAGCGCCA AAGGTTGAAG GTGATAAAGT TTTTATTGAA GTTACGGCAT 8460 

ATCACATAAT GTATGAATTT CAAAATCACT CAGTGGAATC AAATAAGCTT GATGACGACA 8520 

GTAGCGAAAC TGGTAAAACG CCAGAATACT CTTTAGATGA GTACTTAAGA TATGGATTTG 8580 

CAAATCAAAA AACGTCAGTC AAGATGACCT ATAAAATAAT TGGAGATTTT AAAAGAAAAA 8640 

TACCAATTGA TGAATTAGGT AATAAAAATG GCTTAGAATA TTGTAAAGAA GCAGTAGATT 8700 

TGTTTGGTTG TATTATTTAT CCAAATGATA CGGAGATATG TTTTTATTCT. CCTGAAACAT 8760 

TCTATCAAAG AAGCGAAAAA GTAATAAGGT ATCAATATAA TACTGATACT GTGTCTGCTA 8820 

CTGTCAGTAC GTTGGAATTA AGAACAGCTA TAAAAGTTTT TGGGAAAAAG TACACAGCCG 8880 

20 AGGAAAAGAA AAATTATAAT CCTATTAGAA CAACTGACAT TAAATATTCA AATGGTTTTA 8940 

TAAAAGAAGG TACTTATCGT ACCGCAACAA TTGGGTCTAA AGCTACTATT AACTTTGATT 9000 

GCAAGTATGG TAATGAAACA GTTAGATTTA CAATAAAaAA GGGCTCTCaA GGTGGAATAT 9060 

ATAAGTTGAT TTTAGACGGC AAGCaAATTA AGCaAATTTC TTGTTTTGCT AAGTCGGTTC 9120 

AGTCTGAmAC AATAGATTTA ATAaAAAATA TTGATAAAGG CAAGCACGTT TTAGAAATGA 9180 

TATTTTTrGG AGArGrCCCC AAAAATAGAA TTGATATATC TTCAAATAAA AAAGCTAAGC 9240 

CTTGTATGTA TGTTGGAACT GAAAAATCAA CAGTCTTAAA TTTAATTGCT GACAACTCAG 9300 

GTCGCAATCA ATACAAAGCA ATTGTTGaCT ACGTCGCAGA TAGTGCAAAG CAGTTTGGGA 9360 

TTCGATATGC TAATACGCAA ACAAATGAAG ATATCGAAAC ACAGGATAAG CTGTTAGAAT 9420 

TTGCAAAAAA GCAAATAAAT GATACTCCTA AGACTGAATT AGATGTTAAT TATATAGGTT 9480 

ATGAAAAAAT AGAGCCAAGA GATAGCGTAT TCTTTGTTCA TGAATTAATG GGATATAACA 9540 

4Q CTGAATTAAA GGTTGTTAAA CTTGATAGGT CACATCCATT TGTAAACGCA ATAGATGAAG 9600 

TGTCTTTCAG CAATGAAATA AAGGATATGG TACAAATTCA ACAAGCGCTT AACAGACGAG 9660 

TTATTGCACA AGATAATAGA TATAACTATC AAGCAAATCG TATAAATCAT TTATACACTA 9720 

GTACTTTGAA TTCTCCTTTC GAGACAATGG ATATAGGGAG TGTATTAATA TAATGGCAAC 9780 

AGAAGAAGTT AAAATCAAAG CGCTACTTGA AAACGATAAA C 9821 
(21 INFORMATION FOR SEQ ID NO: 471: 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1017 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NOr 471: 

TTATTGTTTT CCAAATGGTC TTCTCGGTTA TTTAACCATC GGTTTCAATC CTACGTGCTT 60 

S 

CACTTTCTAT CtATTAATTC AaTTTCAGCT TGACCACCCG CTGTATAAAG GGTCAAAGTT 120 

GCTAATCGAT AGCGTCTCAT TATAGGACCA ACATCGATAT CAATATTTTG AATACGAAAA 180 

10 TATGGTATTA CCTTTTCATC CAAAAATAAA ATGCCGTTTC GTACACGCAA ATGGTGTTTT 240 

TCAAATGCAT ATCTGCAGTG CTTATATCGA TAGACTGGCG CTATAACAAG CGTGAAAACA 300 

GCAACAAGTA ATATTATAAT CACACTACTA ACAATGGATA AATGGTTATC TAAAATCTCC 360 

CAAAATAGCC AGTTCAAAAT ATTAAATGCG ATTAAAAGTA CAAGCGCTAT GGGTATCCAA 420 

AACAGCACAG CACTTAACCT CATCACTTTT TTAGCGTGTG GTGACATAAA ATTATAATCC 480 

CTCATCATTT TCACCTCTTA AATACCATGA TTTCAATTTA TTTGCATCTT CACTTCTTGC 540 

20 

GTATTTTAAG TTAATCGATT GGGCTCCCAC ACCTTTAGCA ACAATAAAGC TAAAATTATT SOO 

TAAATTGTTG CGTTTAAGTA ATGTATGTTG CCAAGTGTCA AATCCTATAA TGTGATGCGC 660 

TTTAAAATAA TAAATATTTC GTTTCAATAG CTCGAAATTC TGGATAGTAA TTTGTTCTTC 720 

25 

TGTCATTTTA AAACCCGCAT GTTTGACATA AAGATATCCT TTGATCACAA ATAAACCAAT 780 

AATGACTATT GTTATAATCG TAAATAACAA TAATAATTGA TTCCAAAAAT AACAGCCTAT 840 

ACCTGCCATA GCTATGACAA TAATACTAGG TATTAAAAAG TGTCTGTGGA AACCTGACAA 900 

AGGCATACCT TCATTAACTT GTTGATAAGA TAAATCTGGT ACTAAATTCT GGATAATTTG 960 

ATATGCTTTG TCTCGTTTAA TAAACGGCaA TATCGGCACA CTACCTGAAT CATTGTC 1017 
35 (2) INFORMATION FOR SEQ ID NO: 472: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 6806 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNSSS: double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 472: 

45 

TAGGATTGAT TAATCCTTTC TTCAAAATGA TGAATGTGTA ATGTTAAATA TATAATTTCA 60 
GACTCACTGA TATTAACATC AAATTGTTTT TGTATCATAG TTAAAATTTT ATATGCTGTG 120 
TTATAGCAAA TCGGATAGTG ATTTTTAATC ATAGACACAA AATCATCTTG TGCATGTATA 180 
TATTCTTTTC TTCTTAATCG GCGAATTAAA AATTGTACGT GCCTTATAAA ACGTTGGTAT 240 

55 
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TTAATAACAT TATTnGATCA AGGTCATCTC 
AATATGTAAT GCAATAAATC CTATCTCATC 
TAACTGATCA ATCACCTGTT TAGCAATATG 
CATAACAAAT GGATTGCTAA TAACTTGATT 
ATGATCCGTT AATGAAACTA CAAGTTGTTT 
AAAATTCAAC GAATCAATAA TTACTTGTAA 
TTTATAATGX GCTTTTTGTT GCTCACTTTC 
TTGGTCGTTT AACGCCATTC CCTCTTTTTT 
AACTTCTTGA TCATTATTAG TACATACTAC 
ATATTCTCCC ATTATCATCA CCTATTTTTC 
AACTTGAAAG TATAATAATT TAAATACTTG 
TATCTTAATT TAATTTCGAT GTCTCTCAAA 
CCCATATTTA CAAATAATTC TATTTATTTA 
CTAAAACGTA CTATTAAATT GTGCAAAGCT 
TATGTCTTAT CAATGGTATA GTCTTTGCAC 
TATATTAATA TATAATCAAA TCTTAGATTA 
TACAAATTTA AAACCCTGAG ATTTTCGCTT 
TTTATATAAT GAATCGTTAC ATTAAAAATA 
CGCCCCAAGC ACTAATTCCA AATAAGTTAA 
TCTTGCCTTC TTTTTTCTGC TTTTGATAAT 
GTCCTATAAT GGAAATAATG TTTACAATTG 
TCCATACTGT TTCTGTTTTT ACAACTGCAC 
TAAAGATAAA TAATATTACA CGGTTTGTTG 
AGTAATTACC TACAACAGAT GAAAATGCAA 
CTCCAGCAGA ACCTAAATGC TCATTAAGTG 
CGTTATCACC AAATTTCAGT CCTGAATATA 
CCAACATTGT ATCAAAGAAC ACACCTAATG 
GTACGGCAGC AGTTGCCGCT GCATTCGGCG 
AACCACGTTT GATACCTTGA AGAACCGCAG 
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ATGCATAGAT AAATCTTCTG TATTaGATGC 
TTCAGGaAAA TGTaCATCTA ATGCTGCATT 
ATATGCATCA CTATATAACT GCATAGTTTC 
TTGTTTTAAG CGTTTATAAG CAAATATAAT 
TGAATCAACA TTCATCGCAG TATTAGAAAT 
TACATTATCA TCAGCGATTT CAACTAAACT 
TAATTTATAA ATTTTCTCTA TTGTAATAGT 
GTTAAAACCA ATACCTTTAC CGATTAAAAT 
GACATTGTTG TTCAATGTTT TAGTAACAAT 
TATTATTAAG ATTATATATC GGAAATGTCT 
TGTTCTATTA CACGCCTATC CTATATGATA 
GTGGAATAAC TATAATAAAA AAATCTGACT 
TATATTATCT GAATTAATAC TCAATACAAA 
AAAACAAATT TATATTCATC TATCCAACAA 
ACCAATGGAG GAAATAAATC TCAACCTTAC 
ACTAGTGTAA TGATACAGAT GATAATTGAG 
TAATTTGAAA ACCTCAGGGT TTATTTGATT 
TTTATTTATC AGAGTTCTTA TATTTGTTAG 
TTTCTAAGTT TTCAGGTTTA AAGACAGGGT 
CTTTCATCAA TGCAAAAGCT ACATTGGACA 
CCATTAAGCC CATAAATAAG TCTGCCGTAT 
CGACAAAGAC AAGTACTACA ACAAGACATC 
ATAAAAATTC AATATTAGAT TGACCGTAAT 
ACAGTGTAAC tGCTaTTGTT AAGAAAATAC 
CTGATTGAGT AACTGCAACA CCTTGAGGTG 
GTAAAATCAT GATTGCAGTT GCTGTACAAA 
ATTGGATTAA ACCTTGCTTA ACAGGGTGTG 
CAGAACCCAT ACCAGCTTCG TTAGAGAATA 
CACCTACAGC GCCACCAGTT ACTTGTTCGA 
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GCAATATTAC TAAAACCATA CCAATGTAAA TGATAGCCAT AATCGGTACA ATTAACGAAG 2160 

ATAACGTAGC AATACTACGT ACACCACCAA ATATAATAAT AGCTGTTACG ATTGCTAftAA 2220 

5 TAATACCTGT GATTACTGGA CTAATATTAT ATTGCGTATT TAACGACTCC GCAATTGTAT 2280 

TAGATTGCAC TGTGTTAAAT ACAAATGCAA ATGTAATTGT AATTAAAATC GCAAATACGA 2340 

TACCTAGCCA TTTTTGATTT AAACCTTTAG TAATATAGTA AGCTGGACCA CCACGGAATC 2400 

CACCATCTTT ATCATGTACT TTATAAACCT GAGCCAAAGT CGCTTCTATA AATGCACTCG 24 60 

CTGCACCTAT AAATGCAATA ACCCACATCC AAAATACTGC ACCTGGACCG CCTAAAACAA 2520 

TCGCAGTCGC AACACCAGCA ATATTACCAG TACCAACTCT CGAACCAGCA CTAATCGCAA 2580 

15 

ATGCTTGGAA TGGCGAAATA CCCTTCTTAC CATCTTCTAA AGTTTCTGGA CGTTCTACTA 2640 

AAGCTCTAAA CATTTCAGGT AACATTCGTA ATTGAACGAA TTTAGAACTA ATCGTAAAGA 2700 

AGAATCCAGC TGTCAATAAT AGACCAATTA AATATTGAGA CCATATTAAA TCGGTACCAA 2760 

20 

CATGGACAAA TTCTTTAAAC CATCCAGGTA TTAAACTATC GAAATCTTTC AAAATAAACC 2820 

CCTCGCATCC TCTACATGAA TCATGTACCT TCTATAAAAT TAGACCGAAT TGAACCTTCA 2880 

2s GTAAATATAG AGATACATCA TCATTTCTTA TACAATACAA GAGATTTATA TTAGTTTGGT 2940 

CAAAC3TATAT CGCTAATTTA ACGATAAGTA CTTGGTCAGC ATTTAATATA AATCCCTTGA 3000 

ATTTAGTCAA AATTTAACAT TACTGTATTT TATCATTTAA TTTCXSTGATT GCATATAGTT 3060 

30 TTTAGCTAAT ATACATGTCT ATTACTTCAC CAAAATCATC TGTATCTACA ATGAATGAGC 3120 

CATTTGTATA TTGTTCAGAT TTATGAATAT CATTAATTAA ACCATGTTCT TCATTTGATT 3180 

TTGAATATAA TGTATATTGA CTATGTTCAC CTGTCACTAC ATGTGCAGCT ACAATACGAT 324 0 

GTGGATTTTT CTTTAATTCT ITTAATAAAG TTATTCCaCG TTGTGCTCTT TTAGCAACTT 3300 

GTAAGATTTT AAAACTAATA CGTTTTAACG AGCCGCGTTG TGTGGCCATC AATATAGTAT 3360 

CATTTTCAGA AACACCTTCT GTCATAACAA CGAAATCTTC AGCTTTAAGA TTTATTGATT 3420 

40 

TAACACCAGC TGCCCTTAAT CCGGTATCTG ATAGTTCACT TGTATTATAC GTTAATGACA 3480 

TACCTTTATT AGTAATGACG GTAATTAATT GATCTTTTTC AAAGCGCATA ACACTAATCA 3540 

AATCATCATT TTCTTTAACT TTAGTAGCAA TTAAAGGTTT ATTAAAACGC GTTGTTTTAA 3600 

45 

ATAGAGGCAC TGTACTTT7C TTAATCATGC CATTTTGAGT CGCAAAAACA TAAAATGCAT 3660 

CTGTATTAAA GTCCTTTTCA TTAAAGACAT TAATAACCAC TTCATCTTCT TCGATAGGAA 3720 

so CTATTTGTGA TACATGTTGT CCCAATTCTT TCCAACGAAT ATCTGCTAAT TTATGAACCG 3780 

GTATAAATAG ATAACGACCT TTATTTGTAA ATACTAGTAC GGTATCTTGC GTATTTACTT 3840 
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TAAAGCTACG AATAGAAGTA CGTTTAATAT 
CTTCACTAGG CACCATAACT TCTTTGTCAA 
5 AAGACAGTCG TTCAGATTTG AATTTCTTTT 
TCAATAATGC ATCATGGTTA TCAAGAATAT 
CTTTATGTTC ACCTTCAAGC GCAACTATGT 

10 

TTACAATTGC TTCAGCCTGT TCTTCTGTGA 
CGTCACGCTT GTTTTTAGAG CwACGAATCA 
CTTTAATCAA ACCTTCAACG ATATGCATAC 

15 

TTCTATTTGC AACAACCTCA ATTTGGTGAT 
CCATCAATTT TGGACGACCA TCACTAATAG 
AATCAGAGTT TTTATAAAGA TAATTTTTGA 

20 

CAATTGCTAT TCGTAAACCA GTTCTATCAG 
CTTTTTTGTC AGCACGTAAT TCATCGATAC 

25 ATGGAATTTC AGTAATAATT AACTGTTTAC 
TAGAACGAAC TATAATTCTA CCTTTACCTG 
CTTGAATAAT ACCACCAGTT GGAAAATCAG 

30 CTGTAATATC CGGATTATCA ATATATTTAA 
GTGGTGGTAT ATCTGTCGCG TAACCTGCAG 
TAGGAAATCT TGATGGCAAT ACCATTGGTT 
AAGAAACTGT CTCTTTATTA ATATCACGTA 
CTTCAGTGTA ACGCATTGCC GCTGGCGGAT 
TTTCTATTAA GACATGTCGT AACTTCCAGT 

40 

CTGAGGAGTC TCCATGTGGA TGATATTGAC 
TACGGAAATT TTTATCGTGT GTATTACCAC 

GTACTGGTTT TAAACCATCA CGAACATCTG 

45 

TATATCTTCC AAAGCGATCA CCTAAAACAT 
TCACTAGATT TCCTCCTCAT CAAATTGATC 
so TAAAATACTT TGGTCCTCTT GCATACCAAA 
AGGTTGTACT TTGTCACCCA TTAATGTTGT 

55 



ATCCATGACG TGTCATACTT AAAATAACTy 3960 

TTTTAATTTC TTCAATTTCT GCTTCAATTA 4020 

TAATTTCATT CAATTCTTCT TTTATGACAT 4080 

GACGTAATTG TTTGATTAAT GCTTCAAGTT 414 0 

CAGTATTTGT TAAACGATAT AACTGTAACA 4200 

ACTCGTATAC TTCGATAAGG TTTTCTTTAG 4260 

ATTCGATTAC TTTATCTAAA ATTGACAACG 4320 

GTTTTTCTGC ATTATCTAAT TCAAACTTCG 4380 

TCAAATAACT ATCTATAATT TGACGAATAC 4440 

CGACCATGTT GAAATTATAT GAAATCTGTA 4500 

TTGATTCACT GTTCACATCT TTTTTCAATT 4560 

TTTCATCACG TACTTCAACG ATACCATCGA 4620 

GTTTTACTAA GCTACTTTTG TTCACTTCAT 4680 

GTCCATTGCG TAAAGTTTCT TCTTCAACTT 4740 

ATTCATAAGC TTTTTTAATA CCATCAATAC 4800 

GACCTTTAAT ATATTTCATT AATTGATTGA 4 360 

GTGTTGCTTG AATCACTTCA GCTAAATTAT 4920 

ATATACCTGT AGAACCATTC ACTAGTAAGT 4980 

CGAGTGTCGT ATCATCATAG TTTGGAATGA 5040 

ATAACTCTTC AGCTAGTAAG CTTAACTTAG 5100 

CATTATCGAT ACTACCATTA TTACCATGCA 5160 

CTTGACTTAA ACGGACCATT GCTTCGTACA 5220 

CAATAACATC ACCGACTGTT TTCGCACTTT 5280 

TTGAATACAT TGCATATAAA ATACGACGTT 5340 

GCAATGCACG CTCTTGAATA ATATATTTAC 5400 

CTTCAAGTGA TAAATCTTGA ATTATTTCAC 5460 

ATTTTCAAGC ACTTGTACTT CAGAATTATC 5520 

CTCAACATGC TTTTCAATCC ATTCACGTCT 5580 

TACACGTTTA GATGAACGCA CTTCATCTTC 5640 
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AGGGTTCATT TCACCCAAAC CTTTGTAACG TTGTAACGTG AaGCCTTTAC CAAGTTCTTT 5760 

TTGCAATTTA TTAACCTCTT CGTCTGTCCA AGCGTATTCA ACTCGCTTTG TTTTGCCTTT 5820 

5 ACCTTTTTCC AATTTATAAA GTGGAGGTAA AGCAATAAAT ACACGACCTG CTTGAACAAG 5880 

CGGTTTCATA TATTTGAAGA AGAATGTTAA CAATAGCACT TGAATATGCG CACCATCAGT 5940 

ATCAGCATCA GTCATAATAA TTACACGATT ATAATTACTA TCTTCAATTT TAAAGTCAGT 6000 

10 

ACCAACGCCT GCCCCGATTG TGTGGATAAT TGTATTAATT TCTTCATTTT TAAAAATATC 6060 

TTCTAGACGT GCTTTCTCTG TATTAATTAC CTTACCACGT AATGGTAATA TCGCTTGGAA €120 

TTTGCGGTCT CGTcCAAGTT TTGCTGAACC TCCCGCAGAA TCACCTTCGA CTAAATACAA 6180 

15 

TTCATTTTTT TCAGTGTTTT TACTTTGTGC AGGTGTTAAT TTACCAGATA GCAAAGTGTC 6240 

TTTACGCTTG TTTTTCTTAC CTGAACGAGC ATCTTCACGA GCTTTACGTG CAGCTTCCCT 6300 

TGCTTGTTGT GCTTTAATCG CTTTTTTCAC AAGTGATTTA GACAATTGTC CTTTTTCTTC 6360 

20 

TAAATAGAAT GGCAATTTGT CTGCAACAAC TGAATCAACA GCACTTCTAG CTTCAGAAGT 6420 

ACCCAATTTA GATTTCGTTT GTCCTTCAAA TTGCAATAAT TCTTCTGGAA TACGAACAGA 6480 

25 CACAACAGCT GTTAAACCTT CACGAATATC ATTACCATCT AAGTTTTTAT CTTTTGTTTT 6540 

AAGTTCATTA ATACGACGTG CATAATCATT AAATACACGT GTCATT6CTG TTTTAAAACC 6600 

AACTTCATGT GTACCACCAT CTTTAGTACG TACATTATTT ACAAAACTTA AAATACTTTC 6660 

30 TGAATATTGA TCATTATATT GGAAAGCTAC GTCTACCTCT ATACCATTTG CTTCACCTGA 6720 

AAATGTAGCC ACGTCATGCA AAACTTCTTT TCCTTCATTG ACATAACTAA CAAACTCTTT 6780 

GATTCCTTCT TATAATGGTA TGTCTT 6806 
(2) INFORMATION FOR SEQ ID NO: 473: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1716 base pairs 

(B) TYPE: nucleic acid 
40 (C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

^ (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 473: 

GGGGCAnAAA TTCCAATACA CTCATTACCA AATATATACA CCACTTCCTG CTACAAGTnn 60 

TTTTACTTGA TCTTGGTCTT TTCCGCAGAA AGAGCATTTC CAAATTTTCT TCATCTTCCA 120 

SO TTGAATTTAA ACATTCTTTT TACACCCCTA TTCGTTAAAG ACTATACTAG ATTGGATGTT 180 

ACAATGCAAC ATATTAACAT ACAAACTTTT TGCTTAAAGA ATAGTAGCAG ATACATAAGC 240 
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CCtTCAACGA ACTTTGCGTT ATCTCTTAAT AAATCGATAA CTTTTTGGAT ACGAACATCA 360 

TTTTTAATGA TATCAGTATT ACCTAAAGTA TTTTTGATAT CTTCAACTGA GATATTAAAT 420 

TGTTTACTCA TTTTTTCTAA TTCTTTATCG ATATCTTCAT CAGTAGCTTC GATTTTTTCA 480 

GCTTCAGCGA TCGCAGTTAA AGTTAAGTTA GTTTTAACAC GTTGTTCTGC ATCGTCTTTC 540 

ATTTGCTCTC TTAATTGAGT TTCATCTTGA CCTGAGATTT GGAAGTACGT TTGTAAATCT 600 

AAACCTTGTT GTTGAATTCT TXGTGCAAAT TCAGACACCA TACGATCTAA TTCAGTATTA 660 

ACCATTGCTT CAGGAATATC GATTGTTGTA TTATCAGTAG CTTTTGTAAT CGCTTCTTCT 720 

TTTTCAACAT TTTCAGCATC TGTAGCTTTT TGTTCAGCTA AACGTTTACG TAAGTTTTCT 780 

rrGTACTCGT CTACTGTATT TGCTTCTGCA TCTAATTCAT TAGCAATTTC ATCTGTTAAT 840 

TCTGGGACTT CTTTAAATTT AATTTCGTTA ACTTTTGTTT TGAAAGTTGC TTCTTTACCG 900 

GCTAATTCTT CAGCATGGTA TTCTTCTGGG AATGTTACGA CAACATCTTT TTCTTCGTCA 960 

ACTTTCATAC CTTCTAATTG CTCTTCGAAA CCAGGTATGA ATGAACCTGA ACCGATTTCT 1020 

AAATCGTAAC CTTCAGCTTG TCCACCTTCG AATTCTTCtC CGTCAACTGA ACCACTAAAG 1080 

2s TCGATGTTAA CTGTGTCXSCC ATTTTCAACA ACACCATCTT CTTTAACGAC CATTTCAGCT 1140 

AAATGTCCTA AGCTGTGGTC AATCGCTTCT TGTAACTCAT CATCAGATAA TTCAGTTTCT 1200 

TGTTTTTCAA TTTCAAGACC TTTATAGTCT CCTAATTTAA CTTCTGGCTC AACTGTAACT 1260 

30 GTTGCTTCAA AAATGAAATC TTTACCTTTT TCAATTTGAG TAACACTTAC TTCtGGTTGT 1320 

GCAACTGGTT TAATATCAGT TTCGTCAATT GCTTCACCAT AAGCATCTGG TAATAAAATG 1380 

TCGATAGCAT CTTGATATAA TGCTTCTACA CCAAAGCGTT GTTCAAAAAT TGGACGTGGC 1440 

ACTTTACCTT TACGGAATCC AGGTACGTTA ATTTGTTTAA CCACTTTTTT GAATGCTTGA 1500 

TCTAACGCTT TGTTTACTTT T7CTGCAGGA ACAGTAACAG TTAATAAACC TTCGTTACCT 1560 

TCCTTTTTTT CCCAAGTTGC TGTCATGTAT ATATACCTCC ATGATTAACT AATTTATTTT 1620 

TTCAACTTCC CTATTATATC ATACGTCTAT TCCCTATACA AACATTGAAA TCACAACGTT 1680 

TATATATTTG TAAATCAACT TTTTTCGTCA AAACTA 1716 
(2) INFORMATION FOR SEQ ID NO: 474: 

43 

ii) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 7 95 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 
SO (D) TOPOLOGY: linear 
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TGACCAAGTA CGTTTCGAAG TTGCCATTAA AGCATTAAAC CCATCATTGA AAGCATTCGC 60 

ACCTGTACGT GAGTGGGCAT GGAGTCGTGA AGAAGAAATC GATTATGCAA TTAAACATAA 120 

TATCCCTGTA TCAATCAACC ATGATTCACC TTATTCTATC GATCAAAATC TATGGGGCAG 180 

AGCGAATGAA TGIGGTATTT TAGAAGATCC TTATGCTGCG CCACCAGAGG ATGCGTTCGA 240 

TCTAACAAAT GCTTTAGAAG AAACACCAGA TACTGCTGAT GrAATCATTT TAACGTTTGA 300 

TAAAGGCATC CCAGTTCAAA TTGATGGCAA AACATATGAA TTAGACGATT TAATTTTAAC 360 

GTTGAATGCA TTAGCTGGTA AGCATGGTAT CGGAAGAATT GACCATGTAG AAAATAGACT 420 

TGTAGGTATC AAATCAAGAG AAATTTATGA GGCACCTGCT GCAGAAGTTA TTTTAAAAGC 480 

GCATAAAGCA TTAGAAACGA TTACGTTAAC GAAAGATGTC GCACACTTTA AACCAATCAT 540 

TGAGAAGCAA TTTGCTGAAC AACTATACAA TGGACTTTGG TTCTCACCTT TAACTGATAG 600 

CTTGAAATTA TTTATTGATA GTACTCAGCA ATACGTAAGT GGTGATGTCA GAATTAAATT 660 

ATTCAAAGGT AATGCCATCG TGAATGGTAG AAAATCACCT TACACATTAT ATGATGAAAA 720 

ATTAGCAACT TATACAAAAG AAGATGCATT TllATCAAGAC GCTGCTGTTG GCTTTATCGA 780 

TATCTATGGT TTACC 795 
(2) INFORMATION FOR SEQ ID NO: 475: 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 887 base pairs 
30 {B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 475: 

CGATTGAAAG AAGACGGTTC AGTTGAAAAG TTTCCAAAGC CAGTAATTAG CCAACAACCA 60 

GAAGGATATA CGAGTCATTT TAGAGATCCT AAAGTTTTTA AATATGATGr GaAATATTAT 120 

GCAATCaTTG GTGCmCaAAA TAATGATCaG CaAGGTCGAT TATTACTTTA TAATACTGAA 180 

GATATAATTA ATTGGCATTA TTTAGGTGAA ATAAATACAG AGTTGGATGA TTTTGGATAT 240 

ATGTGGGAAT GCCCAGATTA CTTTAATGTA GATAATCAAG ATGTCATACT TATTTGTCCA 300 

CAAGGTATTG AACCAAAAGG CGATCAGTTC AAAAATATTT ATCAAAGTGG TTATATACTT 360 

GGAAAGTTTG ATATTGAAAA GTTAACATAT GAACATGAAA ATTTTGTCGA GCTTGATAAT 420 

GGTTTTGATT TCTATGCACC TCAAACATTT TTAGATGAAA AAGGCCGACG AGTACTAATT 480 

GGATGGATGG GGTTACCGGA AATCGAATAT CCTACTGATA ATGAAGGATG GGCCCATTGC 540 
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GCGTTGGAAA AATTACGTCA CAATAAAGAG ACAGCATTtA GGCCACGCAA ATAAATTTAC 



660 



TCGAAAATTA CATCCGTATG AAGGTAAACA GTATGAATTA ATCATAGATA TTTTGGATAA 



720 



TGATGCTACC GAAGTGTACT TTGAATTACG TACATCTAAG ACTTCTTCAA CATTAATTGC 



780 



TTATAACAAG CGTGAAAATA AAATAACATT AGATCGCAGC GACAGTGGTT TATTGCCGAC 



840 



AAATGTTGAA gGTACGACGC GTAGTACGAT ATTAGACACG CCATTAA 
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(2) INFORMATION FOR SEQ ID NO: 476: 

<i) SEQUENCE CHARACTERISTICS: 

(A} LENGTH: 1183 base pairs 
(3) TYPE: nucleic acid 
(C) STRANDEDNESS : double 
(D3 TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 476: 

TTGGAAnCAA AAAACCATTG GTAAACCGTG TTnAACCGGA TTTCCGATGG ACCTTTTAAA 60 

ACnACCAAAT AGAAAGCTTT GATAAAAGGT AATTATGGTA CTGATAACAA ACAAGTTCAA 120 

AAACATCATG ATTTAGTACG TATGCTTTTG ATGGATCAAG ATGGTTTTTT AACTGAAAAT 180 

AATAAAGTTG ATCATTTCAT TGATGGAAAT GATTTATATG ATCAAGTTTT AAAAGATATT 240 

AAAAATGCAA AAGAtATATC CATTTAGAGT ACwATACTTT CGCTTwAGAT GGTTwAGGTA 300 

AAAGAATTTT ACATGCTTTA GAAGAAAAAT TGAAACA?W3G TCTAGAAGTA AAAATATTAT 360 

ATGATGATGT TGGATCTAAA AATGTTAAGA TGGCAAATTT TGATCATTTT AAATCGTTAG 420 

GTGGAGAAGT TGAAGCATTT TTTGCTTCAA AATTACCGTT ATTGAATTTC AGAATGAATA 480 

ATAGAAATCA TAGAAAAATC ATCGTAATCG ATGGTCAACT AGGTTATGTC GGAGGATTTA 54 Q 

ACATTGGTGA TGAATATCTm GGATTAGGAA AATTAGGATA TTGGAGAGAT ACGCATTTAC 600 

GTATACAAGG GGATGCGGTT GATGCACTGC AGTTGCGATT TATTTTAGAC TGGAATTCGC 660 

AAGCGCACCG TCCACAATTT GAATATGATG TTAAGTATTT CCCTAAAAAG AACGGACCAT 720 

TGGGCAATTC ACCAATTCAA ATAGCTGCAA GTGGCCCGGC TAGTGACTGG CATCAAATTG 780 

AATACGGTTA TACAAAAATG ATTATGAGTG CAAAGAAATC TGTATATTTA CAATCACCAT 840 

ATTTCATTCC GGATAATTCA TATATaAATG CCATTAAAAT TGCTGCTAAA TCAGGTGTAG 900 

ATGTACATTT AATGATTCCA TGTAAGCCAG ATCATCCATT AGTATATTGG GCGACATTTT 960 

CAAATGCCTC TGACTTATTA TCAAGTGGTG TTAAAATTTA TACGTATGAA AATGGATTTA 1020 

TACATTCTAA AATGTGCTTA ATTGATGATG AAATCGTATC AGTGGGCACA GCAAATATGG 1080 
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CTAAAGATTT AAGGGTGGCT TATGAACATG ATATTACAAA ATC 1183 
(2) INFORMATION FOR SSQ ID NO: 477: 

(i> SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2332 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SBQ ID NO: 477: 

GGTTATATGT TTGGTATTAC TCATTATATT GATTGGAGGT TGTGTCATTA TGACAAAAAC 60 

AAATGGTCGA AACGCTCAAA TTAAAGAAAA TTTCAACAAA ACATTAAGTG TATATCTAAC 120 

CAAGAATCTC GATGATTTTT ACGATAAGGA AGGTTTTCGA GATCAAGAAT TTGATAAAAG 180 

AGATAAAGGG ACTTGGATTA TTTATTCTGA AATGGTTATC GAACCAAAAG GGAAnAATAT 240 

GGAATCGAGA GGAATGGTGC TCTATATCAa TCGCAATACT AGAACmACGA AGGGTAATTT 300 

TATTGTCACC GAAATAACTG AAGATAGTAA AGGATATTCA CGTAGTAAAG AAAAAAAATA 360 

25 TCCTGTCAAG ATGGAAAATA ATCGAATTAT TCCAACAAAG CCTATACCGG ATGACAAGTT 420 

AAAAAAAGAG ATTGAAAACT TTAAGTTCTT TGTACAATAT GGAAATTTTA AAGATTTTAA 480 

AGATTATAAA AATGGTGATA TTTCATATAA TCCTAATGTG CCAAGTTATT CTGCAAAGTA 540 

30 TCAATTGAAT AATGATGACT ATAATGTTCA ACAGTTAAGA AAACGATATC ATATTCCAAC 600 

CAAACAAGCG CCCGAATTAA AATTGAAAGG ATCCGGCAAT TTAAAAGGCT CATCCGTAGG 660 

ATCTAAGGAT CTAGAATTTA CGTTTGTAGA AAATCAAGAA GAGAATATCT ATTTTTCAGA 720 

TTCGGTCGAA TTTACACCTA GCGAGGATGA TAAATCATGA GTCAAACGGA ATATCAAATA 780 

AAATCTGGCA ATATAAAAGG TAACTCTGAA GAAACAAGTA CAGTATCTAA TATAAGTTAT 840 

GAAATAGAAA ACGCAAATAA CAGTGGTTTA AAACAAAATA AAATTGATAA ACAAATTAAA 900 

AAGTTACAAG AAAAAAATAA ATTCCCTAAA AATCTTTCAT ATCTTAAAAG TTATACGGAC 960 

CCCAAAACAG GCACGACTAC AAGCGCCTTT TTAAATAAAG ACACTGGCAA AGTTACTTTA 1020 

GGTATGACAG GTACTAATGT ACACAAAGAC GCAATATTAA AACAAACATT TGGTGTTCCT 1080 

TCTTATCAAG GATATATAGA CGTGAGTGAA ACgCTaAAAG ATATTGGGGC CQATGTCAAT 1140 

ATTGGCCTTC ATTCCGTCAC AGATAAAGAT CCACATTATA AAAATACCCA AGACTTTATC 1200 

AAAAATATCA AAAAAGACTA TGATATTGAT ATTATTACCG GACATTCGCT GGGCGGTAGA 1260 

GATGCGATGA TTTTAGGTAT GAGTAATGAT ATTAAACATA TCGTTGTGTA TAATCCAGCT 1320 
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ATTGAAAAGT ACGATGGTCA CATTGTAAGA TTTGTGTCTG ATGAAGACGA ATTAGATGCA 
GGTGTCCGCA ATCATTTATA TGAAACTGCT GGAGAAAAAA TAGTACTTAA AAATGGAGAA 
GGCCATGCAA TGAGTGGTAT TTTAATGAGC AGAACACAGG CTATAATCTT AGCTGAATTA 
AACAAAGTTA AAGGCTACCA AGACGAAAAT AATAAAGCAT TAAAATCCGT TCGTAAACAA 
ACGAGGCATA GATTACATAA AGTAGAGACG TTAAGAGCGA ATTGGATTCA AACAACGGGT 
GGATCACTCT CTTCCTCCCw ACAACAATTA TTAGAAGCTT TAACAGCACT AACCATTGCC 
GAAGGCTTAA ATCAATTAGT GAATGAAGAA AGCCAACATT TGAAAAAATG TATCACGCGA 
TGGCACATAA ATTTGGAGAC AACTGGAAAA AAGCGCAAGA AGTTGGAAAT GAAATTGGTG 
AAAAATTAAC CTCTGAAGAG GTTATAGATG rATTAAGAAA AGGTGGCGCG TATGAAAGTa 
AACTTGAAAC AGATCCCAAA AGAAAAATTG ATGATAAGAT AAAGAAATTA AATGATGTTT 
ATAAAAATTG TAATGGCTAT ATCGCAAAAA TTAAACAGAG TATCGAAGCA ATTGTTTCTA 
ATGACCAAAT GTTAGCGAGC CAGATTGATG GGATGATGTA ATGTTTACTA CGTATAAnAA 
TATTAATGAA CTTGAAAATG CCTATGATGA AGAAAGAAAA CAATTGAATG ATGCATTCAA 
TCAAATTGAT GAATTAAGAC ATCAAACACG CAAGAmATGT GAACAAATGT ATGATCATTT 
CTTATATCTC AAACATAAAA TGAATTmyms TGAAGACGCT ATGATCAGGA TGACACGTAT 
TATAGAATCT TTCGATAGAG AAACGAATCA ACGTATCCGA CATCACGAAA TG 
(2) INFORMATION FOR SEQ ID NO: 478: 

(i) SEQUENCS CHARACTERISTICS: 

(A) LENGTH: 865 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION; SEQ ID NO: 478: 
TTTACTACCC AGTATCTCTT TTTATAAATT ATATAGCCAC CACATATGGT GGAAAGTCTT 
TTTAATTAGA ATTTTGTTTT TTCAGTTAAG AAAGCTTCTA ACTCTGAGAT TGGCATACGA 
ACTTGTTCCA TTGAATCTCT GTCACGTACT GTAACTTGAT TATCTTCTAA TGAATCAAAG 
TCGAATGTtA CACAATAAGG TGTaCCGATT TCATCTTGAC GACGGTATCT TTTACCGATA 
GATTGTGATT CATCGAAATC GATTGAGAAT TTAGAACTTA ATTGCTCAAA AATCTTAATC 
GtTCGCCAGA TAATTTCTTA CTTAAAGGTA AAATCGCTGC TTTATATGGT GCTAATGCAG 
GATGGAAGTG TAAAACTGTA CGTGCATCTT TACTACCTTC AACGCCTTCT TCATCATATG 



60 
120 
180 
240 

300 
360 
420 
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GAATATATTT TTCGTTCGTT TCTGGATCAT GGTATCTGAA ATCTTCACCA GAGTGTTCAG 540 

CATGTTTACG TAAGTCGAAG TCTGTACGAC TTGCGATACC CCATAACTCA CCCCAACCAA 600 

ATGGGAATTT ATATTCAATA TCAGTTGTTG CATTTGAGTA ATGAGATAAT TCATCTTCAT 660 

CATGATCACG TAAACGCATA TTTTCACTGC TCATATTTAA GCTTGTTAAC CAGTCACTTG 720 

CAAAAGTTTT CCAATAATTT TGCCATTCGA TTTCTTCTCC AGGTTTACAG AAGAATTCAA 780 

GTTCCATTTG TTcAAATTCT CTTGTTCTGa AAATGaAGTT ACCTGGAGTG aTTTCaTTAC 840 

GGaATGaTTT ACCAATTTGG ACCGG 865 
(2) INFORMATION FOR SEQ ID NO: 479: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 144 4 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 479: 



25 


TAATGAGTAA 


ATAAGTACCA 


GATAAAATCA TGAATATCAT 


CCAACATGCG 


GTTAACTCTA 


60 




CTAAATAATT 


AATAATAGTA 


TTTTCAGTAA ACAAAGAACT 


ATGTATACTT 


CGCATCACAT 


120 




TAGAATACGT 


ATGTTTCGCA 


TTTTGATCTG 


CAACAAATTG 


ATTGTTATGA 


TCTAGAAAGA 


IBO 


30 


CGTAACGTTG 


ATTTCCTGCC 


ATATCACTCA 


GTGTAATTCG 


TTTGTTATAT 


GGTTCATCAA 


240 




GTATGCTAAC 


TTTACTTACA 


AAGAATCCTT 


CATATTGTTG 


TTCAACTTGA 


TGTACTGCAT 


300 




CATTTAATGT 


TTGATGCGTT 


TTTACATCAC 


TGTCACCAAA 


AAACTCATTC 


TTATAAATAT 


360 


35 


TATTTTCAAC 


TTCTGGAAAG 


AACAAGTAAC 


CAATGCCCGA 


AATGGTTAAA GTGATTAACA 


420 




GTGGAGCAAT AAATATTGCT 


GCATAGAAAT 


GTAATCTTTG 


TAATGGATTA 


AATGTArrrr 


480 


40 


TCATATTTCC 


CTCCCAATTG 


GCTATTATAC 


GGTGTCAATT 


CTGTGATGTG 


TGTGAACAAA 


540 


CTGTGACAAT 


ATTTATTTTC 


TAGAAAAATT 


TAACGATGAT 


TTGTGATTTT 


TAGAAAAATG 


600 




AACTTTTAAG 


TTGGAATGTT 


TGAAGAAAAT 


TGATTATTCG 


TATGTTTTAT 


CAAGCAGCTA 


660 


45 


TGATAAAATT 


TAAACATAAT 


ACAATGCGAG 


CCATTTAACG 


ATCTATGTTT 


AAATGGACAT 


720 




CGATATTGTA 


TGAATTCGTT 


GTAACAAGCA 


AGOVTTTCTA 


TGTGAACGAA 


CCAAAGGGGA 


780 




AAGTAACATG 


ATTAATAAAG 


AACAATTAGA 


TCTTTTATAT 


AAATTAAAAA 


AAGAAGTTGA 


840 


SO 


AAAGTCGCGA AATGAAGCAC 


TTTTACATAC 


AATTAACCAA 


GTAATTAAGA 


AAGTATATTT 


900 




GCAGCAATAT 


ACATGTTCGT 


TCGTTGGACA 


TTTTTCTGCA 


GGTAAATCGA 


CACTGATAAA 


960 
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TATTGTGTCA GTTTCAGACA ATCACGATAT TATTGCTAAT TTGCCGAATC AAACGTATGC 1080 

CAAATTATCT AATTATGATG AAGTAAGGGA AATGAATCGC CAAAATGTCG ACGTTGAATC 1140 

5 TGTAGAAATT AATTTTCAAT CAGCTAAATT TGAAAATGGG TTTACGTTGC AAGATACACC 1200 

AGGTGTTGAT TCAAATGTTG CATCACATCA GTCAATAACA GAACA^TATA TGTATACAAG 1260 

TAATATGATA TTTTATACGG TTGACTATAA CCACGTTCAA TCTGAACTTA ACTTTAAGTT 1320 

TATGAAGCAT ATAAATGATG TTGGaATACC TGTTGTGTTT ATCATTAATC AAATTGACAG 1380 

CATCCAAGAC GATGGAATTG TCATTCTCTA CGTnTTAAAT CTCGAGTTGG AAAAATCAAT 1440 

TGGC 1444 



IS 

(2) IMPORMATION FOR SEQ ID NO: 480: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 6309 base pairs 
CB) TYPE: nucleic acid 
20 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

2^ . (xi) SEQUENCE DESCRIPTION; SEQ ID NO: 480: 

GCAGCAGCTT ATCGTGAGTT ATCATTATTA TTACGTAGAC CTCCAGGTCG TGAAlcCATAC 60 

CCAGGTGACG TATTCTACTT ACATAGTAGA tTATTAGAAA GAGCAGCAAA ATTAAACGAT 120 

30 GACTTAGGTG GCGGTTCAAT TACTGCATTA CCAATTATCG AAACACAAGC TGGTGATATT 180 

TCAGCTTATG TACCAACAAA CGTTATTTCA ATTACAGATG GACAAATCTT CTTACAATCT 24 0 

GATTTATTCT TCTCAGGTGT AAGACCAGCG ATTAATGCCG GACAATCTGT ATCTCGTGTT 300 

^5 GGTGGATCTG CACAAATTAA AGCAATGAAG AAAGTTGCTG GTACGTTACG TCTTGACTTA 360 

GCGTCATACA GAGAACTTGA ATCATTTGCA CAATTCGGTT CAGACCTTGA TGAATTTACT 420 

GCAAGTAAAT TAGAACGTGG TAAACGTACT GTTGAAGTCT TAAAACAAGA TCAAAACAAA 480 

40 

CCATTACCAG TCGAACACCA AGTGTTGATT ATTTATGCAT TAACAAAAGG ATATTTAGAT 540 

GATATTCCAG TTGTAGATAT CACACGTTTT GAAGACGAGT TAAACCACTG GGCAGAATCA 600 

AATGCTACTG AACTGTTAAA TGAAATCAGA GAAACTGGTG GCTTACCAGA TGCTGAGAAG 660 

TTTGACACAG CAATTAACGA ATTCAAAAAA AGCTTTAGCA AATCTGAATA ATAAACAAGT 720 

TTAGTATAAG GTGGTGAGAT AGTGGCTTCT CTTAAAGAAA TAGATACTCG AATAAAATCA 780 

5^ ACCAAAAAAA TGAAGCAGAT TACGAAAGCG ATGAACATGG TATCAAGTTC AAAACTTCGT 840 

AGAGCTGAAA AAAATACAAA ACAATTCACA CCATATATGG ATAAAATGCA AGATGCAATT 900 
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ACTAGAAGTG GATATTTAGT TATCACGAGT GATAAAGGTT TAGCAGGTGC ATATAGTGCA 1020 

AACGTGCTTA AAAAATTGAT TACTGATATT GAAGCGAAAC ATCAAGATAG TAGCXjAATAC 1080 

5 AGTATTGTAG TTTTAGGGCA ACAAGGTGTT GATTTCCTAA AAAATAGAGG TTATGACATT 1140 

GAGTATTCTC AAGTAGACGT ACCTGATCAA CCTTCTTTCA AATCTGTTCA AGCACTAGCT 1200 

AACCATGCTA TAGACTTATA CAGTGAAGAA GAAATTGATG AATTAAATAT ATACTATAGT 1260 

10 

CATTATGTCA GCGTTCTTGA AAACAAGCCT ACATCTAGAC AAGTATTACC ATTATCTCAA 1320 

GAGGATTCTA GTAAGGGGCA TGGTCATTTG TCTTCTTATG AATTTGAGCC AGATAAAGAA 1380 

TCTATCTTAA GTGTAATCTT GCCTCAATAT GTTGAGAGTT TGATTTACGG AACAATATTA 1440 

15 

GACGCAAAAG CAAGTGAGCA TGCAACACGT ATGACTGCGA TGAAAAATGC CACTGATAAT 1500 

GCAACTGAAC TTATTGATGA CTTATCATTA GAATATAACA GAGCGAGACA AGCAGAAATT 1560 

ACGCAACAAA TTACTGAAAT TGTTGGTGGT TCCGCAGCGC TTGAATAATA TTTAAAGGAG 1620 

20 

GAAAATAGCA TGGGAATTGG CCGTGTAACT CAAGTTATGG GTCCTGTAAT TGATGTTCGA 1680 

TTTGAACATA ACGAAgXTCC TAAAATTAAT AACGCCTTGG TTATTGATGT GCCTAAAGAA 1740 

2s GAAGGTACAA TACAACTAAC ATTAGAAGTT GCGCTGCAAT TAGGTGACGA CGTTGTTCGT 1800 

ACAATTGCGA TGGATTCAAC TGATGGTGTC CAAAGAGGCA TGGATGTAAA AGATACAGGC 1860 

AAAGAAATTA GTGTACCTGT TGGTGACGAA ACATTAGGTC GTGTATTTAA TGTACTAGGT 1920 

30 GAAACAATTG ACCTTAAAGA AGAAATTAGT GATTCTGTTC GCCGCGATCC TATCCATCGT 1980 

CAAGCACCAG CATTCGATGA ACTTTCAACA GAAGTTCAAA TTTTAGAAAC AGGTATTAAA 2040 

GTAGTAGATT TACTAGCACC TTATATTAAA GGTGGTAAAA TCGGATTGTT CGGTGGTGCC 2100 

GGTGTAGGTA AAACAGTATT AATCCAAGAA TTAATTAACA ACATCGCTCA AGAGCACGGT 2160 

GGTATTTCTG TATTCGCCGG TGTAGGTGAA CGTACTCGTG AAGGTAACGA TTTATACTTC 2220 

GAAATGAGTG ACAGTGGTGT AATTAAGAAA ACAGCCATGG TATTCGGGCA AATGAATGAG 2280 

40 

CCACCTGGTG CACGTATGCG TGTTGCATTA TCTGGTTTAA CAATGGCTGA ATATTTCCGT 2340 

GACGAACAAG GTCAAGACGT ATTATTATTC ATCGATAACA TTTTCAGATT TACACAAGCT 2400 

GGTTCTGAGG TATCTGCATT ATTAGGTCGT ATGCCTTCTG CAGTAGGTTA CCAACCAACA 2460 

45 

CTTGCTACTG AAATGGGACA ATTACAAGAA CGTATTACGT CTACAACAAA AGGATCAGTT 2520 

ACTTCTATTC AAGCGGTATT CGTACCTGCC GATGACTATA CTGACCCAGC GCCTGCGACA 2580 

SO GCGTTTGCCC ATTTAGATGC AACTACAAAC TTAGAACGTA AATTAACTGA AATGGGTATT 2640 

TATCCAGCCG TGGATCCATT AGCGTCTACA TCAAGAGCAT TGGAACCATC AATTGTAGGT 2700 
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CAAGATATCA TTGCTATCTT AGGTATGGAC GAATTATCTG ATGAAGATAA ACAAACAGTT 
GAACGCGCAC GTAGAATTCA ATTCTTCTTA TCTCAAAACT TCCACGTAGC GGAACAATTT 
ACTGGTCAAA AAGGTTCTTA TGTACCTGTT AAGACAACAG TTGCAAACTT TAAAGATATC 
TTAGATGGTA AATATGACCA TATTCCAGAA GATGCATTCC GTTTAGTTGG TAGCATGGAT 
GAXGTTATTG CAAAAGCTAA AGATATGGGT GTTGAAGTAT AACAATTAGG AGGAATGGAT 
AATGAATACA TTAAACCTAG ATATTGTCAC TCCTAATGGT TCTGTTTACA ATCGTGATAA 
TGTTGAACTC GTTGTTATGC AAACAACAGC TGGTGAGATA GGTGTCATGA GTGGACATAT 
TCCAACTGTA GCTGCTTTAA AAACAGGCTT TGTAAAAGTG AAATTTCACG ATGGAACTGA 
ATATATTGCT GTAAGCGATG GCTTTGTTGA AGTTAGAAAA GATAAAGTTT CAATCATTGT 
TCAGACTGCA GAAACTGCAA GAGAAATTGA TGTTGAAAGA GCTAAATTAG CCAAAGCAAG 
AGCAGAGTCT CACTTGGAAA ATGATGACGA CAATACTGAT ATTCATAGAG CCGAAAGAGC 
TTTAGAGAGA GCAAATAACC GTTTGCGTGT GGCTGAATTA AAATAGTAAA TAAAGGGTCG 
AAGATGTGAT TTCATATCTT CGACCCTTTT TTGAATTATA TTGATTTAAA GATACAAAAC 
ATQAGAGGGG GGAAGGAATT GATAAAGAAC CATTAAAGAT TTATGATGTA GTGGTTCTTT 
ATCATTAAAC ACAGCTAATG TGTATTTAAA AATAGGaayA CATgAGTAAA ACTCATGTAT 
AAGAAATACT AATTTCTAAA GAAAAAGTAT TTCTTTATGT TGGGGCCCCG TCAACTACTG 
CCAAATACAA CACTATAGAG TCTAGACATT GATTTATGTC CGACTCCCAA GAATAGTTTT 
ACTTTTTTAC AATCACTAAT AGATTGCTAA AATCAAAATT TCCTTCACCA CTATCTACAG 

> 

TCGACATTTC ATTTTTTGAA ATTATCTACA TTTTTTCATA CCAAGATATT TTATAGTTAT 
GATATTTATG TAAAAAGAAT TATATAGTAA GTTAGCTTAA ACTTTACTAA AAACGGGTAT 
TAAACTTTGT ATCATTATTT AAATTTTTCA TGTACAATGT AATACAGTAA TCTTATGAGG 
TGATAAAATG GATTATATCG GACAATATGC AGTTATCCAT TTAGTGTTAC ATGTTGTATG 
TATTTGTATT GCCTATTGGG CTTTACAATC AATTAGATTA GATCAATTTT TTAAAAAAGG 
ATACGCCACT CAATTACAAG TGTGTATGAT ATTTGTTGCT ATTTTATTAG GCACTGCAGT 
AAGCAATTTT ATTGTAGATT TGTTACAATA CTCGACGCAG GTAAAATATT TAATAAAATA 
AGTCTAACTC TATGATTTGT AATCAAAACT AGATATAATT AAATAATGAC TTAAAATAAT 
TTTAAAATAG GGAAATGTAA AGTAATAGGA GTTCTAAGTG GAGGATTTAC GATGGATAAA 
ATAGTAATCA AAGGTGGAAA TAAATTAACG GGTGAAGTTA AAGTAGAAGG TGCTAAAAAT 
GCAGTATTAC CAATATTGAC AGCATCTTTA TTAGCTTCTG ATAAACCGAG CAAATTAGTT 



2820 
2830 
2S40 
3000 
3060 
3120 
3X80 
3240 
3300 
3360 
3420 
3430 
3540 
3600 
3660 
3720 
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3840 
3900 
3960 
4020 
4080 
4140 
4200 
4260 
4320 
4330 
4440 
4500 



55 



1406 



EP 0 786 519 A2 





GACGTTACAT 


ACAAAAAGGA 


CGAAAATGCT 


GTTGTCGTTG 


ATGCAACAAA 


GACTCTAAAT 


4620 




GAAGAGGCAC 


CATATGAATA 


TGTTAGTAAA 


ATGCGTGCAA 


GTATriTAGT 


TATGGGmCCT 


4680 


5 


CTTTTAGCAA 


GACTAGGACA 


TGCTATTGTT 


GCATTGCCTG 


GTGGTTGTGC 


AATTGGAAGT 


4740 




AGACCGATTG 


AGCAACACAT 


TAAAGGTTTT 


GAAGCTTTAG 


GCGCAGAAAT 


TCATCTTGAA 


4800 


10 


AATGGTAATA 


TTTATGCTAA 


TGCTAAAGAT 


GGATTAAAAG 


GTACATCAAT 


TCATTTAGAT 


4860 


TTTCCAAGTG 


TAGGAGCAAC 


ACAAAATATT 


ATTATGGCAG 


CATCATTAGC 


TAAGGGTAAG 


4920 




ACTTTAATTG 


AAAATGCAGC 


TAAAGAACCT 


GAAATTGTCG 


ATTTAGCAAA 


CTACATTAAT 


4980 


70 


GAAATGGGTG 


GTAGAATTAC 


TGGTGCTGGT 


ACAGACACAA 


TTACAATCAA 


TGGTGTAGAA 


5040 




TCATTACATG 


GTGTAGAACA 


TGCTATCATT 


CCAGATAGAA 


TIGAAGCAGG 


CACATTACTA 


5100 




ATCGCTGGTG 


CTATAACGCG 


TGGTGATATT 


TTTGTACGTG 


GTGCAATCAA 


AGAACATATG 


5X60 


20 


GCGAGTTTAG 


TCTATAAACT 


AGAAGAAATG 


GGCGTTGAAT 


TGGACTATCA 


AGAAGATGGT 


5220 




ATTCGTGTAC 


GTGCTGAAGG 


GGAATTACAA 


CCTGTAGACA 


TCAAAACTCT 


ACCACATCCT 


5280 




GGATTCCCXSA 


CTGATATGCA ATCACAAATG 


ATGGCATTGT 


TATTAACXX5C 


AAATGGTCAT 


5340 


25 


AAAGTCGTAA 


CCGAAACTGT 


TTTTGAAAAC 


CGTTTTATGC 


ATGTTGCAGA 


GTTCAAACGT 


5400 




ATGAATGCTA 


ATATCAATGT 


AGAAGGTCGT 


aGTGCTAAAC 


TTGAAGGTAA 


AAGTCAATTG 


5460 




CAAGGTGCAC 


AAGTTAAAGC 


GACTGATTTA 


AGaGCAGCAG 


CCGCCTTAAT 


TTTAGCTGGA 


5520 


30 


TTAGTTGCTG 


ATGGTAAnAC 


AAGCGTTACT 


GAATTAACGC 


ACCTAGATAG 


AGGCTATGTT 


5380 




GACTTACACG 


GTAAATTGAA 


GCAATTAGGT 


GCAGACATTG 


AACGTATTAA 


CGATTAATTC 


5640 


35 


AGTAAATTAA 


TATAATGGAG 


GATTTCAACC ATGGAAACAA 


TTTTTGATTA 


TAACCAAATT 


5700 


AAACAAATTA 


TACCTCACAG 


ACAGCCATTT 


TTATTAATTG 


ATAAAGTAGT 


TGAATATGAA 


5760 




GAAGGTCAAC 


GTTGTGTGGC 


TATTAAACAA 


GTATCAGGAA 


ACGAACCATT 


CTTTCAAGGG 


5820 




CATTTTCCTG 


AGTATGcGGT 


AATGCCAGGC 


GTATTAATTA 


CTGAAGCGTT 


AcTCAAACAG 


5880 




GTGCGGTAGC 


TATTTTAAAT 


AGTGAAGAAA 


ATAAAGGTAA 


AATCGCTTTA 


TTTGCTGGTA 


5940 




TTGATAAATG 


TCGTTTTAAA 


CGTCAAGTAG 


TACCTGGTGA 


TACTTTAACG 


TTGGAAGTAG 


6000 




AAATCACTAA 


AATTAAAGGA 


CCAATAGGTA 


AAGGTAATGC 






bU bU 




AACTTGCTTG 


TAGTTGTGAA 


CTTACATTTG 


CAATTCAAGA 


TGTAAAATAA 


AACAAAAAAA 


6120 




ACATTCAAAG 


ATTTAATGTG 


TTGGCATAAT 


CTTTGAATGT 


TTTTTATTTT 


ACTCTTCTAA 


6180 


50 


TTTTTCATCC 


TTTAACTTTG 


GTTTAGACTG 


CaTCATTCGA 


TTAAATGATT 


TTTTTAATTC 


6240 




TTCACCAGAT 


AATCCATCAT 


CAATAAGTTG 


GTTCTAATAA 


ACTTTCAGCA 


TACTGTTGGA 


. 6300 
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(2) INFORMATION FOR SEQ ID NO: 481: 

(i) SEQUENCE CHARACTERISTICS: 

lA) LENGTH: 1717 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



10 

ixi) SEQUENCE DESCRIPTION: SEQ ID NO: 481: 

AGTTGCTACA CCAGACATGA TGGGTGAAGT TGGTAAATTA GGTCGTGTAT TAGGACCAAA 60 

AGGTTTAATG CCAAACCCTA AAACTGGAAC TGTAACAATG GATGTTAAAA AAGCTGTTGA 120 

AGAAATCAAA GCTGGTAAAG TAGAATATCG TGCTGAAAAA GCTGGTATCG TACATGCATC 180 

AATTGGTAAA GTTTCATTTA CTGATGAACA ATTAATtGAA AACyTCaATA CyTTACAAGA 240 

20 TGTATTAGCT AAAGCTAAAC CATCATCTGC TAAAGGTACA TACTTCAAAT CTGTTGCTGT 300 

AACTACAACA ATGGGTCCTG GAGTTAAAAT TGATACTGCA AGTTTCAAAT AATAAATGAT 360 

ATAAACAATT ACAGGCTGAA AGAAATATCT TTCAGTCTGT AAAAATATAT TGACAATAAG 420 

25 TAATTTCCAA GTTATATTAC TTATTGTGAT TATTTTACCT AAGACAGTAG GAGTTATTTA 480 

TAACTTAAAA TTTATCCTGC CGAGGCTAAA ATTGACTTGA ACGTGATGAT CTATGATCTT 540 

TCAAGCACTT TTTGCCGTGG GTAGAAAGTG CTTTTTTTAT TAATTTTAAA AAAAGCACCA 600 

AAAATTTAAA TGGAGGTGTC TGAATGTCTG CTATCATTGA AGCTAAAAAA CAACTAGTTG 660 

ATGAAATTGC TGAGGTACTA TCAAATTCAG TTTCAACAGT AATCGTTGAC TACCGTGGAT 720 

TAACAGTAGC TGAAGTTACT GACTTACGTT CACAATTACG TGAAGCTGGT GTTGAGTATA 780 

AAGTATACAA AAACACTATG GTACGTCGTG CAGCTGAAAA AGCTGGTATC GAAGGCTTAG 840 

ATGAATTCTT AACAGGTCCT ACTGCTATTG CAACTTCAAG TGAAGATGCT GTAGCTGCAG 900 

CGAAAGTAAT TTCTGGATTT GCTAAAGATC ATGAAGCATT AGAAATTAAA TCAGGCGTTA 960 

TGGAAGGCAA TGTTATTACA GCAGAAGAAG TTAAAACTGT TGGTTCATTA CCTTCACACG 1020 

ATGGTCTTGT ATCTATGCTT TTATCAGTAT TACAAGCTCC TGTACGCAAC TTCGCTTATG 1080 

45 CGGTTAAAGC TATTGGAGAA CAAAAAGAAG AAAACGCTGA ATAATTTTTA GCGTAAAAAA 1140 

ATTAAAAATA ATGGAGGAAT TATAAAATGG CTAATCATGA ACAAATCATT GAAGCGATTA 1200 

AAGAAATGTC AGTATTAGAA TTAAACGACT TAGTAAAAGC AATTGAAGAA GAATTTGGTG 1260 

TAcTGcAGCT GCTCCAGTAG CAGTAGCAGG TGCAGCTGGT GGCGCTGACG CTGCAGCAGA 1320 

AAAAACTGAA TTTGACGTTG AGTTAACTTC AGCTGGTTCA TCTAAAATCA AAGTTGTTAA 1380 



30 



35 



40 
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TCCTAAAGTA ATCAAAGAAG CTTTACCTAA AGAAGAAGCT GAAAAACTTA 



AAGAACAATT 



1500 



AGAAGAAGTT GGAGCTACTG TAGAATTAAA ATAATTCAAG TATCTTAAAC 



TTAATAATCA 



1560 



AAGTTTTATA GCAAGTATTG CTATAATATA ATGATTCTTT GAGAAGTTAA 



AACCCCGTTA 



1620 



TTTTGATAAC GGGgTtTTAT TCaTTTAAAG ACTGAGTGAA ATGTTATAAT 



TATAATGACG 



1680 



AGTTACAAAG TGAAGATGAG GTGGGAATAA TGAGTCA 



1717 



10 



IS 



20 



2S 



30 



35 



40 



4S 



SO 



(2) INFORMATION FOR SEQ ID NO: 482: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1279 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 482: 

GTAAATCTGT TACTCGAAAT GTAACGATTA AAGAAAAGGG CTCATCTCAA ACATATATTT 60 

TGTTAGGCTA TCCAACAAAA GCACAGAAGA ATAGTCATAG CAAATATAGT GGAGTCTTTA 120 

TATATAAAGA CTTGAAATCA ATCGAAGATA CAAATAATGC TATTACGATT ATCACCATAA 180 

TTACGGCTGT TATTTTCTTA ACAATTACAA CAGTCTTTGC GTTTTTCTTA TCGTCAAGAA 240 

TTACAAAACC TTTAAGACGT TTAAGAGACC AAGCTACACG TGTATCTGAA GGGGATTACT 300 

CTTATAAACC TTCTGTCACA ACGAAAGATG AAATTGGTCA ATTATCGCAG GCATTTAATC 360 

AGATGAGTAC AGAAATCGAA GAGCATGTCG ACGCATTATC CACATCTAAA AATATTAGAG 420 

ACAGCTTAAT TAACTCTATG GTAGAAGGTG TCCTAGGTAT TAATGAGAGT CGACaAATTA 480 

TCTTATCTAA TAAGATGGCG AATGATATTA TGGACAATAT TGATGAAGAT GCTAAAGCTT 540 

TCTTATTAAG ACAAATAGAA GATACTTTTA AATCAAAACA AACTGAAATG CGCGATTTAG SOO 

AAaTGAATGC ACGATTCTTT GTTGTGACCA CAAGCTATAT CGACAAGATT GAACAGGGAG 660 

GTAaAAGTGG TGTTGTTGTG ACAGTTCGTG ATATGACTAA TGAGCACAAT CTAGATCAAA 720 

TGAAGAAAGA TTTCATTGCT AATGTATCAC ATGAATTACG TACACCGATA TCATTACTTC 780 

AAGGTTATAC TGAATCAATT GTAGATGGTA TTGTTACAGA ACCGGATGAA ATAAAAGAAT 840 

CGCTTGCCAT TGTCCTTGAT GAATCGAAAC GTTTAAATCG TTTAGTTAAT GAATTGTTAA 900 

AIGTCGCACG CATGGATGCT GAAGGGTTAT CCGTAAATAA AGAAGTTCAG CCTATTGCAG 960 

CGTTACTAGA TAAGATGAAA ATTAAGTATC GCCAACAAGC TGATGATTTA GGTCTAAATA 1020 

TGACTTTTAA TTAyTGTAAG AAGCGTGTTT GGAGTTATGA TAwGGATCGC ATGGACCAAG 1030 
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TTACTTGTGA TGAAAATGAA AGCGAAGATA TTTTATACAT TAAAGATACA GGTACAGGCA 
TTGCACCAGA ACATTTACmA CAAGTATTTg ATCGTTTTTA TAAAGTTGAT GCAGCGnAnA 
ACCCCGnGGT AACCAnGTA 
(2) INFORMATION FOR SEQ ID NO: 483: 
(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1144 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNSSS : double 

(D) TOPOLOGY: linear 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 483: 
GAGCTGTTGT TACTTTGATG CCTGCAGCTT TATTACGGCT GACTTGGTAA TGATAAGTTT 
CAGCATATTG CTCAATATAT GCTATATCAT ATTGAATGGT ACGAGGTGAT ACACCAAGTT 
GATTAGCAAT GGTATTGATT GGAATAAACG TTTGCTCATG AATTAAAAGA TACAAAATTT 
CGATTTGTCT ATAACTTAAC AACGTAATAT CCTCCTATTT GTAATTGTAA GCGATTTCTT 
AAAAACGTAG ATATGCAATC TCTTTCATAT TTTAATCCGA AAAATTGCAT ATCAAAATGT 
TTATGGCGCA AGATTTTATA GGAACTTTTA AAATAAATTA rATATTCATG TTGACAATTT 
AAAAATGTCG CAGTATATTT AGTTAGACAT CTAACGAAAT GGTGGTGCAA TAAATGGAAT 
TCACTTATTC GTATTTATTT AGAATGATTA GTCATGAGAT GAAACAAAAG GCTGATCAAA 
AGTTAGAGCA ATTTGATATT ACAAATGAGC AAGGTCATAC GTTAGGTTAT CTTTATGCAC 
ATCAACAAGA T6GACTGACA CAAAATGATa TTGcTAAAGC ATTACAACGA ACAGGTCCAA 
CTGTCAGTAA TTTATTAAGG AACCTTGAAC GTAAAAAGCT GATCTATCGC TATGTCGATG 
CACAAGATAC GAGAAGAAAG AATATAGGGC TGACTACCTC TGGGATTAAA CTCGTAGAAG 
CATTCACTTC GATATTTGAT GAAATGGAAC AAACACTCGT ATCGCAGTTA TCTGAAGAAG 
AAAATGAACA AATGAAAGCA AACTTAACTA AAATGTTATC TAGTTTACAA TAAATGATAA 
GTGTGACTGG TAGAAATCAG TCACTTTGTC TTTAATATTA TAGTTAGATA TCTAATTGTT 
AGTAAGCTAA TTATTGGAAA AGACAAGGAG TATTGAACAA TGAAAGACGA ACAATTATAT 
TATTTTGAGA AATCGCCAGT ATTTAAAGCG ATGATGCATT TCTCATTGCC AATGATGATA 
GGGACTTTAT TAAGCGTTAT TTATGGCATA TTAAATATTT ACTTTATAGG ATTtTyAGAm 
GAyAGCCACA TGATTTCTGC tAatCTCTCT AACACTGCCA GTATTTGCTA TCTTAATGGG 
GTTA 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 115B base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



JO 



75 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 484: 

ACAACCAATT TTACTAAACA TGGTrrTCAT gCATTTTCAA TATTTAGATG TCGACCGCAT 60 

AATCGAAGAA TCGCCGACAA TAGTACTTAT CGATGAGTTA GCACATACGA ATATTTCTAG 120 

AGATCGTCAT GAGAAACGAT ATATGGATAT TGAAGAAATT TTAAATCATG GTATCGATGT 180 

TCATACCACT TTGaACATTC aaCATATTGA AAGTTTAAGT AGTCAAATTG AACTGATGAC 240 

CGGTGTACAT GTTAAAGAAC GTGTACCCGA CTATTTCATA ATGAGCGCCG ATGTATTAGA 300 

20 AGTCGTAGAT ATCTCACCTG AACAATTAAT TAAACGCTTA AAAGCTGGCA AGGTATATaA 360 

AAAGGATAGG CTAGATGTAG CATTTAGTAA TTTCTTTACG TATGCCCACC TAAGCGAAtG 420 

CGTACATTGA CGTTAAGAAC AGTTGCCGAC TTGATGAGTG ATAAAGAAAA AGTCCGACAC 4 80 

25 AACCATAAAA CGTCACTCAA ACCTCATATT GCTGTGGCAA TTAGTGGGAG CATTTATAAT 540 

GAAGCAGTAA TTAAAGAGGC ATTCCATATT GCTCAAAAAG AACATGCGAa GTTCACTGCT . 600 

ATTTATATAG ATGTATTCGA AAAAAACAGG CAATATAAAG ATAGTCAAAA GCAAGTGCAT 660 

CAACATCTCA TGCTTGCAAA ATCATTAGGA GCAAAAGTAA AAGTAGTTTA TAGCCAAACC 720 

GTTGCATTAG GATTAGACGA ATGGTGTAAA AATCAAGATG TAACCAAATT AATTATCGGA 780 

CAACATATTA GAAATAAGTG GCGAGACTTT TTCAATACAC CTTTAATTGA CCATTTAATG 840 

TCCTTTGAAC ATAGCTATAA AATCGAAATC GTTCCAATCA AACAAATACC TGTTGAATTG 900 

AAAATGAACA AATCACCCTA TCGTCCTAAA GGCAAACGTT TCGCCATAGA TATGTTAAAA 950 

ATGATTTTGA TTCAAATAAT TTGTGTAATG ATGGGACTGT GGATTTATCA ACTTGATAAG 1020 

CATGAGTCTA GTACGATTAT TTTAATGATT TTTCTCATCG GCATCATTTT ATTATCCATT 1080 

TGGACGCGGT CCTTCATCAT TGGCTTTTaG CAGCAATTAt TAACGTATTT GTgTkTAATT 1140 

45 ATkTTTTtAC GGAACCTA 1158 
(2) INFORMATION FOR SEQ ID NO: 485: 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTO: 2224 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 485: 
ATCATATGGT CGATTTAACA GATCCAACGT ACTGCtAAAT AATTACATGA CGTTTAAACA 
TAGCATTGAT TATAACTATT TCTA^GTCTT CGCATTATTT GCGATGATGT GGGAATAGTT 
ATTTTTATTT AAAAATATAA AAAAATAGAT GCAGCAAAAT TTTAAAGCAT TTTATTTTGA 
ACATATTAAA AGGGAGCGTA TCATAATGGA ATGTAATGTT TATATCGTAT GCATTACGGA 
TAAATAATAT ATAAATCATT CTTGAGGAGT GAAAGAATAA TGAGAGACTA CACAAAGCAA 
TACATTAATG GCGAATGGGT AGAAAGTAAT AGTAATGAAA CGATAGAAGT TATAAATCCA 
GCAACCGAAG AAGTAATCGG GAAAGTTGCT AAAGGTAATA AAGCTGATGT TGATAAAGCC 
GTCGAGGCGG CAGACGATGT TTATTTAGAG TTCCGTCATA CATCTGTGAA AGAAAGACAA 
GCGITATTAG ATAAAATTGT AAAAGAmTAT GAAAACAGAA AAGACGATAT TGTACAAGCT 
ATTACGGATG AATTAGGTGC TCCTTTATCA TTATCTGAGC GTGTCCATTA TCAAATGGGA 
CTAAACCATT TTGTTGCAGC GAGAGACGCA TTAGATAACT ACGAATTTGA AGAACGCCGC 
GGAGATGATT TAGTTGTTAA AGAAGCAATC GGTGTATCTG GATTAATTAC ACCGTGGAAC 
TTCCCTACAA ACCAAACATC ATTAAAATTA GCAGCAGCAT TTGCGGCTGG TAGTCCAGTT 
GTACTTAAAC CATCTGAAGA AACACCATTT GCAGCTGTTA TTTTAGCTGA GATTTTTGAT 
AAAGTCGGTG TTCCTAAAGG TGTATTTAAC CTTGTTAATG GTGATGGTGC TGGTGTTGGG 
AATCCTTTAT CTGAACATCC TAAAGTACGC ATGATGTCAT TTACAGGATC AGGCCCTACT 
GGTTCTAAAA TTATGGAAAA AGCCGCTAAA GATTTTAAAA AGGTATCATT AGAGCTTGGT 
GGCAAATCAC CATATATCGT CCTAGATGAC GTAGATATTA AAGAAGCGGc TAAAGCAACa 
aCAGGCAAAG TTGTTAATAA TACTGGTCAA GTATGTACAG CTGGTACACG TGTTTTAGTG 
CCTAACAAAA TTAAAGATGC ATTCTTAGCT GAATTAAAAG AACAATTTAG CCAAGTGCGT 
GTCGGTAATC CAAGAGAAGA TGGTACACAA GTAGGCCCTA TCATTAGTAA AAAACAATTT 
GATCAAGTAC AAAATTATAT TAATAAAGGT ATTGAAGAAG GTGCTGAATT ATTTTATGGT 
GGTCCTGGTA AACCAGAAGG ACTTGAAAAA GGATACTTTG CACGTCCGAC AATTTTTATT 
AATGTAGATA ATCAAATGAC GATAGCACAA GAwGAAATTT TTGGGCCAGT AATGTCAGTT 
ATCACTTATA ACGATTTAGA TGAAGCGATT CAAATTGCAA ATGATACAAA ATATGGTTTG 
GCAGGATATG TTATTGGTAA GGACAAAGAA ACATTGCATA AAGTAGCTCG TTCTATTGAA 
GCAGGTACAG TAGAAATAAA CGAAGCAGGT AGAAAGCCAG ATTTACCATT TGGTGGCTAT 
AAACAATCTG GTTTAGGTCG TGAATGGGGC GATTATGGTA TTGAAGAGTT CTTAGAAGTG 



60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
840 
900 
960 
1020 
1080 
1140 
1200 
12S0 
1320 
1380 
1440 
1500 
1560 
1S20 
1680 
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AGTGCACATG ACTAATTAAG TTTTGTGTAC TGTTTTAATT TTGCAATTTT TATAAATAGA 1800 

TTTTGTAATT AAAATAAAAA TTTGCTATAG TTATTCATGT ATTTAAAAGG TTGGGGATTA 1860 

5 GCATAATGGG ATTGTGCTAG CACAGTTATT TATGCATTGT CATGCCTATC TATTACTTAC 1920 

TAACTAAAAA ATAATGAAAT GGGTGTAAAC TATATGCCTG AAAGAGAACG TACATCTCCT 1980 

CAGTATGAAT CATTCCACGA ATTGTACAAG AACTATACTA CCAAGGAACT CACTCAnAAA 2040 

GCTAAAACTC TTAAGTTGAC GAACTATAGT AAATTAAATn AAAAAGAACT TGTTCTAGCT 2100 

ATTATGGAAG CACAAATGGA nAAAGATGGT AACTATTATA TGGAAGGTAT CTTAGATGAT 2160 

ATACAACCAG ATGGTTATGG TTTTTTAAGA ACAGTGAACT ATTCTAAAGG GGAAAAAGAT 2220 

75 

ATTT 2224 
(2) INFORMATION FOR SEQ ID NO: 486: 

(i) SEQUENCE CHARACTERISTICS; 

20 (A) LENGTH: 1630 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

25 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 4 86: 
ACATTACnTT GAATCGAAAG TTTCATAAAC GACTTGAATG CCAGTTTCTT TTTCAAATTT 60 

QQ CTTAATTAAC TCTGGATCAA TATATTCGCC CCAATTGTAT ACGTAAATTT TTTGATTTGT 120 
ATGCACTTGT TCTTTAGATT TAAACCAATG ACTTAAAGTA AGACAAAGCA TACCCACAAC 180 
TAATGCACCT ATAATGAGTT GTAAAAATCG TTTCATTATT TTACACCTCG CTTGATTAGT 240 

35 TTTTTCTTAT TTATCACGTA TTGAATCAAA TAATATCCTA GTATTCCTAA TACAATAACA 300 
GCAAACAATA ATGTTGAAAT CGCATTAATT TCCATACTAA TTCCTTTTCT CGCCATAGCA 360 
TAAACTTCAA CTGATAACAC ACTAAAGCCA TTACCAGTAA CGAAGAAACT TACTGTGAAA 420 
TCGTCTAGTG AATAAGTTAA AGCCATAAAG AATCCTCCTA TAATAGAAGG TAAAATATTA 4 80 

GGAATAATAA TGTTGCTTAA TAATTGTGGT TCAGTCGCTC CTAAATCTCT TGCAGCATTT 540 
AACATATTAT TATTCATyTC ATACAGTTGT GGTAAGACGA TAATCACAAC TATAGGTATG 600 

45 

CAAAATGCAA TATGAGATAT TAGAACTGTC CaAAAkCCTA AACCAAGACC AGTAAAATGG 660 
CCAATCGTTG TAAACATAAT TAAGAATGAT GCACCTATGA CAACGTCGGA a-GATACCATC 720 
AAGACATTAT TCAATGTTAG TAAAGTTACT TTAAACTTTT TATTTCTTAA ATAATAAATA 780 

SO 

QCPiXlGGCAC CAAATGTACC AATAACTGTA GAAATTGAGG CTGCTAAAAG TGCTACAGCT 840 

55 
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AATGTAAAAT GTTCAAAGTG AATCATATTA CCAGCCGAAT TGAATGAATA GAACATTAAA 
AAGAATATTG GGATGTATAA AATCGCTAAA AGTATCCCGA TATACAGCTT TCCATACCAT 
TTCATATGAT TCACCCTCTC CCATTAGATG ATTTTGTAAT GATTAAAATG AATGCCATAA 
ATACAATTAA GAATATAGCT ATAGTTGATC CCATACCATA ATTTTGAATT GTTAAAAATT 
GTTCCTCTAT TGCCGTACCT ATATTTATGA CTTTATTACC TGCAATTAAT CTTGTAATCA 
TAAATAATGA AAGTGATGGA ATAAAGGTTA CTTGAATCCC AGTCATAACA CCTTCTTTTG 
TTAACGGCAT GATTACTTTT CTAAAAGTAT AGAAAGGACT GGCACCTAAA TCACTTGAGG 
CCTGCAATAA ATTATTAGGA ATT6CTTTCA TGCTATTAAA TATAGGTAAA ATCATAAATG 
GTATATAAAT GTAACTTGCC ACTACTAAAA ACGCACCAGT TGTAAATAAC AAATTGAATG 
ATGGTAAATT AAATAAGTGG AAAATTGATT AATCACGCCA TCATGACTTA ATAAACCTAT 
AAAAGCATAT GTCTTTAACA ATAAATTTAT CCATGTTGGA ATAATCATTA TCATTAATAA 
GATATTTTGA AATTTCGAAC GAGTAATATA ATAGGCAGnT GGATAACTGA TAGTCAAGGT 
AATAATTGTT ATTGAAGCGG CATATAAAAT TGAATATGCA AACATTTTCA AATATTTTGT 
AGTAAAAATT 

(2) INFORMATION FOR SEQ ID NO: 487: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2112 base pairs 

(B) TYPS: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(Xi) SBQUENC3 DESCRIPTION: SEQ ID NO; 487: 
ACGAAAAGAA ATATTATGAT GAACAAAAAG AAAGAATAAC GATTTATATG AAGTACAATG 
TGAAAGGTTA TAAAAATATA AGCTTCGCTA ATTTTAAAGA AAACCCAATG GATGGTTATT 
CTATTAGTGG TTATATAAAT AAtGaTAAAA AGTTATCATT TACAGCTGGT ATAAGATCTG 
TTGATGATTT TCAATTTGAT ACCGATATTT CTTATACAGA TGAATTGGGT AGAAAATTTA 
ATAAAAATCC TAAGTCAGTT TCTGAAATAA AAAAAGAGCA AAATACGTCC AATAAATAAT 
TGTTCATATT GTGATGAAAC AAAAATATAA GTCATTAGAT GAGTTTAACT ATGTTATAAA 
TATTTGTAGT ATCTATAAAA ATCTCGACAC TATTAAAATG ATAAAGTGCC GAGGTTTTCT 
TACTTATTTA GTTAATTCAA AGTTTATGCC AGATTCATAA GAATTTGTGA CACTTTTAAT 
AGTGTAcCAT TGATTATTAC AATTTATCAA ATGGTCCTTT AGAAGGTATA AATAACAAAA 
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TATTATTATG TTCAAAACTT TACGCTCCAA AAAGTAAAAA GGAAGTTAAG CAATGTTTAG 660 

TTGCTTAaCT TCGGaTATTG AACGCATCAG TCCAATTTGA CATAGAGCCT TTTTTAGTTC 720 

TTGATGTTTC TCTTTAAAAC CTTGCATATT TTACAAAAAG AAAAATTAGC AGTATAATTA 7 80 

AGACAACGAA AATAAGTATT TACTTATACA CCAATCCCCT CACTATTTGC GGTAGTGAGG 640 

GGATTTTTAT TGGTGCGGCT ATATGTCACC TATTTTGTAT TGCGTCTACT TAGCCAATAA 900 

GAAAAAAACG CAATGGCACA GCCACTGATG ACTGGTGCTA TGATGTGAAC GaAAATAAGC 960 

ATCACCTTAT ACACCTCCTC TCTGCGTCTA AATTGACGsC TGAGaGrTAG GcGACTCTAC 1020 

TATTATATCA TCGGCAAATA TACAAGCACA GTCACTTGCT TCTGATAAGT TATATGATTC 1080 

TAGCTGATAG ATTGAATCGT CTACACTTAA TTGGACAAAT TCTATGAGAA TAGATATTGT 1140 

TAATTTAAGA AAGTAGGCGA TTTTATTATG ACAAGAGAAA GAAGATCATT TAGTTCAGAG 1200 

TTTAAGTTAC AAATGGTTAG ATTATATAAA AATGGTAAGC CTAGGAATGA AATTATACGC 1260 

GAGTATGATT TCACACCTTC GACGTTTGTA AATGGCGGTT ATAAAATGTA GGAAAATGGA 1320 

TAAAGCAACA TCAAAACACG GGTACATTCA ATCACCAAGA TAACTTATCG GATGAAGAAA 1380 

25 AAGAGCTGAT TAAATTACGC AAAGAAGTTC AACATTTAAA AATGGAGAAC GATATTTTAA 1440 

AGCAAGTAGC GCTGATTATG GGGCAAAAAT AGAAGTCATT CAAAAGAATG CACATCAATA 1500 

TTCAGTATCA GCAATGTGTA AAGTCCTGAT AATACTAAGA AGTACCTATT ATGATTCTAT 1560 

30 AAAAAGAAAA GATAATAAAA TCACTAAAGA TGATTCAAAC ATAGAACATG CCGTCATAAA 1620 

TATTTTTAAT TCTAATAGAA AAGTCTTTGG TACAAGACGA ATTAAAAATC ATTTAAATGA 1680 

CAAGGGTCTC ACTGTATCTG GACAAAAGAT AGGTCGATCA TGAAAAAATC TAGTTTCTGT 1740 

35 TTATACGAAA TCTAAATACA AAAATCATCT AAAAGAAACT AATGAAAAAC GAATTAAAAA 1800 

TCTTTATTAT TAGCTGCTGG TGTATTATTT GTTAGTCCAA TTTCATTATC TTATAATTCA 1860 

GATGTAGCTC ATGCTGAAGA TAAGTTAGAC CATTCTCAAG CAAAGGTAAT ATATTTGAGT 1920 

AACCAAAATT TATTTGATGA ACTTGAGAAA AAAGGTTATA AACTGGAAGA TATATTTACA 1980 

AAAGAAGAAA TAAAAAAATA TAAAGCTGAA GACCAATTGA GAGCGGGTAA AACTCAATAT 2040 

GfAGAAACAG GTAAAGATAC TGCAACATTA TATCTTTCTT CTGCATATAC AAAAACAATA 2100 

GCTGCTTTAG GT 2112 
(2) INFORMATION FOR SEQ ID NO: 488: 



40 



45 



SO 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4 54 base pairs 

(B) TYPE: nucleic acid 

(C> STRANDEDNESS: double 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 488: 

GTAGGCACAC ATCTGCCATA TAAACATTCT TTTATACTAG TGTTCTCATA TAGTGTAGAG 60 

S 

TTATAGTCTC CTTCTTGAAT CTCGAATAAT TCAATCAACC TATCAACCTT AGTCTCTTCC 120 

GTTACTTCTT TTTCAATATC AACTATGAAG GGGATATCAA TTGGAATAAA ACTTGACGTC 180 

GAACACTTAT TTGTATTTGG ATGAAAACGA ACGAATCCAT CACTAAATCC TGTTGAAAAA 240 

AATATTTTTC CTTGTGATAG ATCCGGATTT TCTCGCGCCC ATTTAATTAA TTCATCTAAT 300 

CTCATTTCTT TTTTAACTTT GATTTTCATT GTTATATCTC CTCTTGAACA GTAAATTTAT 3 SO 

15 CGTTAAtTGA TACGTATCCA GTCACATTAC ATAAGATGCT ATCAACATCA AAAGTCACAC 420 

AACAGTTGCG TTCAACATCA TTTGAATAGA ATCT 454 



{2) INFORMATION FOR SEQ ID NO: 489: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1372 base pairs 
(3) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

25 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 489: 

TTGTCAGAAT TAGAATGCTT TTGAGTTACT TCATAATACT CATCAGTTTT TTGTGTATCC 60 

30 

TTTTGACTTT TATTTATTTC TTTCCACTTA CCAGTATGAC TTTCTTTTTT TACAGTTATT 120 

TTCGGTTTGT TTAAAAAATG ATAACCGATG TTCTTTTTGG TATCTGTGGA CTCTAAAAAG 180 

ACTGAATTGT TTTCCTGATT ATCAGAATTG GTTGTTTGTT TATCGTCTGT ATATAACGTA 240 

35 

TACCCATTCG CTTTGCGATT TTGAATCGTT GTAACTGGAT TCTTTGATGA ATCAGTACTT 300 

TTAATGCCAG TTCCTAAGAA GACAATTTTA TCGTTTAATA TGAAATATGA TTTTTTGGCA 360 

GTTAAAGTTT TGTCCTGATT TTCAAAATCC ATTCCGATAC TAGCATGTTG GTCATCAACT 420 

40 

TTTGTTCCGC CAACAAAAGT TTTACTCGAC TTTTTATCAT CCGTATCTTT TAATATTTCA 480 

TTGTCTAAAG TTGTTGTACC TGATAAACGT TTCATATCGG CTGTCACCCA GAAGTTATCA 54 0 

45 TGATAGTGTT TGACATCGCT GTTATATAAA TAAGACATTC CAGCACCAGT GTGCCAACCT 600 

TTTAAATTCT CTCCGTTGAT ACTTTCATAG CGTGCTACGT TTTTCGACGT CATACTTAAA 660 

CCAAATGCAA AGTCTAAGTC TTTGTTATGA TAGGTGACAC GATCCATGTC ATTATATATT 720 

SO TTAAGTTGTT GTGTTAATCC GTTTTTAGAA ATACTGTTAT CTGTCATTAA AGACTTCATT 780 
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ACTGAAGATT TGACAATCTT TTTATACTTA GCTmGTTC AATCATCCAT GGCATCACTT 900 

AATCTCAACA ATGATTTCAT TACTGTTGCA GATGCTGAGT GACTGGTTTC ATTTTCACGA 960 

CTGATAGCTC TACCTCGTGA TAAATCCATC ATTTCACCTT TATAAATGAG TGGCATAAAT 1020 

CCGTCGTCAA TCCATGACTT TAAGGTTGTA TCATTTTGGG TTTTATCATT AAAAGGTGTT 1080 

TCTTTTATCA TCGGCATCAT TTGAGAAATC CCCTCTAAGA GTACAACGCC ATAAGCACCA 1140 

GTGTATGGAA CGTCTTGATG ATCAATGTAA GAGCCATCTT TATAAAATCC ATTACGTTCT 1200 

TTACCAGTGG CAGAATCTTG AACGTAAGTG AAGACTTTAT TAAATGAATC TATAGACTTT 1260 

TTCATCATAT CTTTATCTTC TTCGATAATA CATTCTAAAA GTTTCACCTT AGAAATGTCT 1320 

ACTAziATTTC CGCCTTTAGC AAGTTCAGnT TTTCCTACAC AAGATAATAT TT 1372 
(2) INFORMATION FOR SEQ ID NO: 490: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 564 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

25 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 490: 
ACAACAATAT AGTAAAGCGT CGTTAATTAA ACAATGGGAC CAATTTGTTC GTCTTATATA 60 
AATGTACTTT aCCTTTATTT TTACAAAAAT AGCATTTTCC TATGTCATTT AACTAAACAT 120 
GTAAGTTCGT ATGAACGAGG TTTGTTAAAT AGATGATTCT AGGAAAATGC TTTTT f CTTl' 180 
TGACTTAGTT TAAAATATTT TGCCACTTTG TACTGATAGT AGTTGCATTG TACTGTTGTG 240 
35 CAGATTCTAT GCTATTAATT GAAAACTGTT GCAATTTTTG AGTATTATTT AGTAATTGGT 300 

CGACCTTTTC AACCATTTGA TTGATGTCAC CTTGAGGTAC TAAATAGCCA TTAAATCCAT 360 
CTTGaATCAG TTCTGaTGGA CCATAATCTA CATCATAACT GATCACTGGT GTACCTACTG 420 
AAAgCGACTC TAAAATTGCT AAGCCAAAAC CTTCCATTTT ACTTGTCGAT AACATCAGTT 480 
CTGCTTTAGC AATCTCTTCA TTAATATGCG TCTTAAAACC ATGAAATTTA ACATGTTCCA 540 
GATATnATGA TAATCTTCTA CAAG 564 
(2) INFORMATION FOR SEQ ID NO: 491: 



30 



40 



45 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1277 base pairs 
<B) TYPE: nucleic acid 
so (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 491: 

TATCCACCCC ACGAnAGCCC CGGAAACTTA TTGTGTTACA AGATATATAA GCAGAAACGA SO 

ACAACAGTTA ACAAAATAAA TGAAATTAAA CGTTTTAAAA ATGAAACAAA TGAAATCATC 120 

TATTAGGTTA TGAAACTGTT TATAGCTTGA ATAGAAGCAT TTATmTTA GGAGGACAAT 180 

TATTATGCGT CAAACATTTA TGGCAAATGA ATCAAACATT GAGCGCAAAT GGTATGTTAT 240 

CGATGCTGAA GGCCAAACAT TAGGTCGTTT ATCATCAGAA GTAGCATCTA TCTTACGCGG 300 

TAAAAATAAA GTAACTTACA CACCACACGT TGATACTGGT GATTATGTAA TCGTTATTAA 360 

TGCATCAAAA ATCGAATTTA CTGGTAACAA AGAAACTGAC AAAGTTTACT ACCGTCACTC 420 

AAATCACCCA GGTGGTATCA AATCAATCAC TGCTGGTGAA TTAAGAAGAA CTAACCCAGA 480 

ACGTTTAATT GAAAACTCAA TTAAAGGTAT GTTACCAAGC ACTCGTTTAG GCGAAAAACA 540 

AGGTAAAAAA TTATTTGTAT ATGGTGGCGC TGAACATCCA CACGCTGCAC AACAACCAGA 600 

AAACTACGAA TTACGTGGTT AATTAGAAGG AGGAAATGAC TTTGGCACAA GTTGAATATA 660 

GAGGCACAGG CCGTCGTAAA AACTCwGtAG CACGTGTACG TTTaGTACCa GGTGAAGGTA 720 

ACATCACAGT TAATAACCGT GACGTACGCG AATACTTACC ATTCGAATCA TTAATTTTAG 780 

ACTTAAACCA ACCATTTGAT GTAACTGAAa CTAAAGGTAa CTATGATGTT TTAGTTAACG 840 

TTCATGGTGG TGnTTCACTG GACAAGCTCA AGCTATCCGT CACGGAATCG CTCGTGCATT 900 

ATTAGAAGCA GATCCTGAAT ACAGAGGTTC TTTAAAACGC GCTGGATTAC TTACTCGTGA 960 

CCCACGTATG AAAGAACATA AAAAACCAGG TCTTAAAGCA GCTCGTCGTT CACCTCAATT 1020 

CTCAAAACGT TAATTGTCGG ACGATATATA CAAAACACCT CGATATTATG TCGAGGTGTT 10 BO 

35 TTTTTGGCGT TTTTGCGGCG AATATGGAAT GTGTAGAATA TAAATGAATT TTTACCTTCC 1140 

CACCATAAAA GATGAAGAAC CA7GAATGTG GAGAACAATA AATAGTTGGA TATTCTGTTA 1200 

TTTTTTTGGA AGTGGAAGTG GATTTGGAAT ACTTTACTCn AAACGATTAA AAGGTTTAAA 1260 

AAAACAACAA AnAGAAA 1277 

(2) INFORMATION FOR SEQ ID NO: 492: 

(i) SEQUENCE CHARACTERISTICS: 
45 (A) LENGTH: 673 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



25 



30 



SO 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 492: 
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TTATTGACAT TGTTTTTATC CAAAATTCAT TGTTAAGACA TTTTCTTTAT GAAATAATAA 120 

TnATATTGAA GTATATTTTT ATTATTATTA AAAATAAATA AGGGGATACT TATGAGCACA 180 

^ AATCAAACAT TTTTAATATT TGTTATAGCA ATTATTCTAC TTACATCTGT AATAGGAATT 240 

GTTGGACGAT ACATGAGTCG TCAACGTCTA TTAAAATCTA TGGAAACATT ATGGCAAACG 300 

ATTTCTCCAT TAGAAGCTTT TATCAGACCG AACTCACATT TCGACTATGA GTATAAGCTC 360 

10 

TACAAGGAAA AATTTGAATC ACATTCATTA GTTGATGATA AAACTTGGTC CGACTTAAAT 420 

ATGAATGCAA TCTTTCATAA GATGAATTAT AATTTAACAG CTATTGGTGA AATGAAGCTA 480 

TATGCCTGTT TAOGTGGAAT GCTTTCAATT ACGAACAAAT CATTACTTAG TTTATTTAAT 540 

IS 

GATAATGCTG AATTTAGAAA AAACGTAACA TATCATTTAG CTTTGATTGG tAAAACTGTT 600 
aTCCAACATT TCCAGACCAA ATCACACCGG kAAACGTCCA AATATATTGn TCTATGCCCG 660 
GTTTACCAGT ATC 673 

20 

(2) INFORMATION FOR S3Q ID NO: 493: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1240 base pairs 
25 (B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



30 (xi) SEQUENCE DESCRIPTION: I 

AAAAAAAGTT AATGCTGACG GTGTATTAAC 
TGAAGTTATT AACGCTATAG GGAAAAGATG 

35 CAAGAAAGAA TATGTAATAA CTGTCATTGA 

TGAATGTACT GCTAGAGAGA TTCCCATAGA 

TGTAACAGGA TCTTTTACAG TAGAAAGATA 

40 

GCTTTTTGAA GTCGAGGGCA AAGTTAAATC 

TACAAGGTTA GAAATGTTTA AAAAGGGATT 

GTATGACAAA AAGAAAGACA GATATAAGTT 

45 

GTCTTATTTT ATTTCTGACG AAtCAACGCC 
GATTTCGCCA CCTTCATTAG AGGATATGGT 
GCTGGGCTCG TAATGGAAGC TAGAAGTGCA 

SO 

GAACCATTTA AAGATGGTAA AGTGACTGAC 



;EQ id NO: 493: 

TTTTGATA1T CTAGAAAATA AATATACTTA 60 

GATTGTTAGT CATGTCGAAG GTGAAAACGA 120 

TAGGAAATCA GAAGGCGACA GACAACTGGT 180 

CAAGTTAATG ATTGATAGAA TTTATGTTAA 240 

TTTTAACATT GTGTTTCAAG GTACTGGAAT 300 

TTCAAAGTTT GAAAATGGTG GTGAAGGCGA 360 

AGAACATTTC GGTTTAGAAT ATAAAATAAC 420 

TGTATTGACG CCTTTTGCAA ATCAAAAAGC 480 

AACGCTATAA AACTCGAGGA AGATGCAAGT 540 

AATTATTCAG GAGAaGAAAC ATTCGAACAC 600 

TTAGCTGAAA TATACGGCGA CATCCACGCA 660 

CAAGAAACTA TGGATAAAGA ATTACAATCG 720 
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TATCCAGAAG CAGACCCACA ACCCXSGAGAC ATAGTACAAA TAAAATCTAC CAAACTAGGT 840 

TTGAATGATT TAGTCCGTAT AGTACAAGTT AAAACGATTA GGGGTATAAA CAATGTAATT 900 

GTTAAGCAAG ATGTAACGCT TGGTGAGTTT AATCGAGAAC AACGATATAT GAAAAAAGTT 960 

AATACTGCAG CTAACTATGT TTCTGGATTA AATGATGTTA ACCTTTCTAA TCCTAGTAAA 1020 

GCGGCAGAAA ACTTGAAGTC TAAAGTAGCG TCAATAGCTA AATCAACACT CGATTTGATG 1080 

AGTAGAACTG ATTTGATTGA AGA7AAACAA CAGAAGGTAA GCTCTAAAAC TGTGACTACA 1140 

TCTGACGGCA CTATCGTTCA TGATTTTATa GATaAATCmA ACATTAAaGA TGTAAAAmCG 1200 

aTTGGAACGa TTGGCGATtC TGTAGCTAGA GGATCACATG 1240 



75 

(2) INFORMATION FOR SEQ ID NO: 494: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1311 base pairs 
O) TYPE: nucleic acid 
20 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

• (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 494: 

ACGGTGGATT TAGCCTAGAA GATTTAACGC ATCAAGGTAa ATTaTCAGCA TTTAGCTTTA 60 

ATGATCAAaC AGGTCAAGCA ACATTGATTA CTAATGAAGA TGAAAACTTC GTAAAAGATG 120 

30 AGCAACGTGC TGGCGTAGAT GCAAATTATT ACGCTAAACA AACATATGAT TATTACAAAG 180 

ACACATTTGG TCGTGAATCA TATGaCAACC AAGGTAGTCC AATTGTTTCA TTAACGCATG 240 

TTAATAACTA CGGTGGTCAA GATAACAGAA ATAATGCCGC ATGGATCGGT GACAAAATGA 300 

35 TCTATGGTGA TGGTGATGGT CGCACATTCA CAAGTTTATC GGGTGCAAAT GACGTAGTAG 360 

CACACGAATT aACACACGGT GTGACACAAG AGACAGCGAA CTTAGAATAT AAGGACCAGT 420 

CAGGCGCTCT AAATGAAAGC TTTTCAGATG TTTTTGGATA CTTTGTAGAT GACGAGGATT 4 80 

40 

TCXTAATGGG TGAAGATGTC TACACACCTG GAAAAGAGGG AGACGCTTTA CGCAGCATGT 540 

CAAACCCAGA ACAATTTGGT CAACCAGCTC ATATGAAAGA CTATGTATTC ACTGAAAAAG 600 

ATAATGGTGG CGTACATACG AATTCTGGAA TTCCAAATAA AGCAGCTTAT AACGTGATTC 660 

45 

AAGCAATAGG GAAATCTAAA TCAGAACAAA TTTACTACCG AGCATTAACG GAATACTTAA 720 

CAAGTAATTC AAACTTCAAA GATTGTAAAG ATGCATTATA CCAAGCGGCT AAAGATTTAT 780 

ATGACgAGCA AACAGCTGAA CAGGTGTATG AAGCATGGAA TGAAGTAGGC GTGGAGTAAA 84 0 

SO 

AATATATAAA CaAGAAGAAG TAATGTTAAA CACTTATAAA TAATTAAATT TTAAATACAG 900 
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ATTAGATGAG AGGAGTGTGA GGG7TGTCTG CCGAAAGACT ACTCGGCAGT CTAAAATCAT 1020 

TACAAGTAGT AGATATGTGA TAATTAAATG CTGACTTAGA ATACAAAATT CATTTTAAAA 1080 

GTTGTCACAA AAAATTTACA TGTATTTTTA TTATCTTTTG CAAAACAAAG TGTTAAATTA 1140 

TAAATGAaAC ATGCATGAAT TTATTTTTTA ATACAAGAAA CGTAACTACC AAAGGAGTTT 1200 

ACAATATGAA GAAAAGTAAA CGATTAGAAA TTGTTTCTAC AATAGTTAAA AAGCATAAGA 1260 

TTTATAAAAA AGAACAAATC ATTTCATATA TTGAAGAATA TTTTGGTGTA A 1311 



(2) INFORMATION FOR SEQ ID NO: 495: 

(i) SEQUENCE CHARACTERISTICS; 
75 (A) LENGTH: 1761 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNES5: double 

(D) TOPOLOGY: linear 

20 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 495: 
TGCACTTTCT AAAAATACTT GCTTTACTTG TTCCAATTCC TTGTCAGACA TTGATTCGGC 60 
TAATTTATTC ATTATTGCCT CAAATACGTT AATTATGTCA TCCATTTCAG TACTATAAAA 120 

25 

ATCAAACCAT TTTGCCGTAT CTTTTTCTCT ATTAAGCTTA TGATCACTTT GAGAGCGCTT 180 

AGCTAATTCT GCATAAATAT ATGGACAAGG TGCCATTGCA GCAATTGTAT AAATAGCATT 240 

TTCACGACTA TGCGCTTGGA AATACATATG TTTTATGTAA TGGTCGCCAC TTGGAGGCCA 300 

AACTTTTGTT TTAATGATTT CTTCGTATGA TTCACCAACA ATTTGCGCTA AAATATCATG 360 

CGCAAGTACT TCACCTTCAA CCATAAATTC TATTTGCTCT ACTAAAAATT TTACGTCATT 420 

. 35 CATGCTATTC ATTTTTGGAA TTAACAAAGC ATATAAGTTT GTAAATTCTT TTAAATACGC 480 

AGCATCAGCT TTTAAGTAAT GGCGTAATGC GTCAGcTCCT ATATCTCCGG ATAACATCTT 540 

CTGAATAAAG TCATCCTCAT AAATATCATT AATGATTGGC TTTGCAGCTT GGTACAATTT 600 

40 

TTGTGAAAAT TCCATTGTAA AAAATCCTCC CTAAATAAAA AAACTACTTC CAACATGAAA 660 

GTAGTTTGAT GGCAATGTTG CTATACTAGC CCCATCACTT CAATAACTAC TTTCCTACGT 720 

TGGTACTAAC CAAATCAGGT CATAAGGGTC TGAACAATTC ATCTCAGCCA TATCATTAGG 780 

45 

CTCCCCTAGT AGTTCCTTAG TATTCAATTG CAAATTAATC TTAGCAAACG GTTTCAACAT 840 

TTTCAATTAT TGTTGCTCAG TTGTATTATT ATCTTTAAAT AATAATTCTA TAATGACATA 900 

TATTTGCGAA ATAAAAAAAC CGGAACATAT CGAGAATTCC CCGATATATT CCAATCTAAA 960 

SO 

AGTTACTTAT ATAACTATTA ATTAGCTATG CATAAATGGC TTATGCAGTA ACCCAATGTC 1020 
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TTGCTGGTGA TACACCTTTA TATTTAGCAG GTGCTACTGA ATCCCAAGTT GATTGTAAGA 1140 

ATT6ATACTT ACCAGCTGCA CCTGgATGTT GGrTTTACAG CATGAATATT GCCACCTGaT 1200 

5 TCACGTTGrG CAATTTGTTT TAGATGAGCa TTCACATTXA CTGATGAACC TTCTGATGAT 1260 

TTTGATyCAG TTGGTGTTGC AGTAACTTGT GAATTGTTTG ATGTTGATGC TTGTGGTTGT 1320 

TGAGTTTGAG CATTTTGTGG TGCTTCAACT TCTTGTGATT GTACTTGATT AGCTTGAACA 1380 

TO 

GCTGATGGTG CAACATTATT AGTTGCAGGT GCTTGTGCAC TCATGTCTGC TCCATTAGTA 1440 

CCTGTTGCAT GGTAATTCCA AGCAAAGTGT GTACCATCTG ATTCAAAGTG ATAAGTAAAC 1500 

CCTTCATAGT CAAATGTATA ATTATAAGCC CCAGCTTCAA TTGGTTTTTG ATTTAATGTT 1560 
15 

TGATCATTTG ATTGCGCCAT TTGCCTGAAA GATGCTTTAT TTAAGTCCGC TTCACnTGCA 1620 
TGGGCTTCGT GGACCTGCAT TTCCTGGCTA CGATTCCTAA ACCTACTGGC nAAnGATGAT 1680 
GCGAGTAATG TTTTCTTCAT AATCTTAAAA TCCTCCTACA AGTGAATTTG TGTCTCTAAA 1740 

20 

AGTTTTACAG TGGACGACTG T 1751 
(2) INFORMATION FOR SEQ ID NO: 496: 

• (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 794 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNSSS : double 

(D) TOPOLOGY: linear 



30 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 496: 

TCATTTATGA AAAATGTCGG AnAGAnCCaa GaAAmaCAAT TGAgCGTGAA GAAAAAGCAA 60 

35 GACTTAAAGA AGAACAAAAG GCACGTCAAA ATGAACAGCC ACAAATAAAA GATGTGAGTG 120 

ATTTTACGGA AGTGCCTCAA GAAAGAGATA TTCCAATTTA TGGGCATACT GAAAATGAAA 180 

GTAAAAGCCA GAGTCAACCA AGTCGAAAAA AACGAGTGTT TGATGCAGAG AATAGTTCGA 240 

ATAACATCGT AAATCATCAT CAAGCAGATC AGCAAGAACA AXTAACAGAA CAAACTCATA 300 

ACAGTGTTGA AAGTGAAAAC ACTATTGAAG AAGCTGGTGA AGTTACGAAT GTATCGTATG 360 

TTGTTCCACC GTTAACTTTA CTTAATCAAC CTGCAAAACA AAAAGCAACA TCTAAAGCTG 420 

45 

AAGTGCAACG TAAAGGACAA GTACTAGAGA ATACATTAAA AGATTTTGGG GTAAATGCAA 480 

AAGTGACACA AATTAAAATT GGTCCTGCAG TAACTCAATA TGAAATTCAA CCAGCTCAAG 540 

GGGTTAAAGT GAGTAAAATT GTAAACTTGC ATAATGATAT TGCATTAGCT TTAGCAGCAA 600 

SO 

AAGATGTTAG AATCGAAGCG CCAATACCTG GTCGTTCTGC AGTAGGTATT GAAGTGCCAA 660 
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ATAAACTAGA AGTTGGATTA GGaAGAGATA TATCAGGTGA TCCAATTACT GTTCCACTAA 780 
ATGAAATGCC ACAC 794 
(2) INFORMATION FOR SEQ ID NO: 497: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1161 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 497: 

AGCCAGTTTT GcATTTCGTC AAATCGCAAT GAATATATTG ATTGCTTGTC AAAATTTGGA 60 

AGAAATTTAT TCTTCTTTTT CTTTTCAGCA GTTATCATTC CTAATTGTCC TTTCTTTTTA 120 

TCTTAGTGAT AAAGAATCCA TCTGAATTAA AGTCTTGCGG CATGATTTGT AACGTTTTGA 180 

CCAACTCTCC AGTTATCGGA TGTTGAAACG GTTCAAATTC GAAGTTTTTA TTATTTTTCA 240 

AAAACGTATA AATCACGTTT TCATTTTCTA GTTGCTCAAT TGTACATGTT GAATAGATGA 300 

TTTCTCCACC TATTTTTACA TTGTTTTTTA CATTTTCCAA TATTTCAAGC TGTAATTCAA 360 

CTAGTGACTC AATATGTTGT TTGCTTTGAG TATACTTAAT CTCCGGCTTA TGTCTCATTA 420 

CACCTAATCC GCTACATGGT GCATCAACAA GTATCTTATC GTATGTTTTA TCATAAGGTT 480 

TTGTCGCATC ATGTTGAAAA GCTTTAATAT TTGTTAATCG TAATTnTTTT ATATTAAAAT 540 

TAATTAAGTC TATTTTGTGA TCATGTATAT CTGAAGCGTC AACTTGCCCT TCTGGCATTA 600 

AAACTTCAGC AATGTGACAA GCTTTACCGC CAGGTGCACT ACATGCATCT AATACGTGAT 660 

35 CATGTCGGTC TACATTCATA ATGTGTGCAa CAAACATTGA GCTTTTATCT TGAATTGAAA 720 

CGAATCCATC TTTAAATGAA CGAGAATGAA TAATTGGTTG TCCTCCTATA TGGAGACAAT 780 

AAGGTAAGTC ATGATCTTTT TCAAC6TCAT AACCTTCGTC TTGCAACTTT TCAATAATAT 840 

CATCTAATGA TGCTCGCGTC AGGTTGGCAC GCACAGTTGT TGATGTCGTT TCTAAAAATG 900 

ACTGTAAAAT TTTTTCAGTT TCTTCGAGAC CATAATGTGT TGCCCAATGA TCTATAATCC 960 

ACTTCGGCAT ACTATACTCG ATTGCCATTC TTTTTTTAGG ATCTGCAATT TCATTAAAAT 1020 

CAGGTAAGTC ACTACGCATC ATTGTACGTA AAATACCATT TACGACATTA CCATTATGAT 1080 

AGCCACCGCG TTCTTTTGCT ATTTCAACTG CTTCATTAAT AATGGCATGA TTTGGAACTT 1140 

TATCTAnATA nACATATTGA T 1161 
(2) INFORMATION FOR SEQ ID NO: 498: 
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(A) LENGTH: 1504 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : doxible 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 498: 

AGCTCACGTC ATCTTCGGCG GCGCTAAATT AAAATAATCA ATTTCTGAGT TAAACTTTTA 60 

TTTACAACAT ACTATTACTA TACATTACAA ATTTTTAAAA TATACATTAC ACTCATTACT 120 

CAATGGtnAAG CGTATGATTT CmCAGCCCCC CTAGCTTGTA GAAATCATAC TTTCCTTTTT 180 

15 TCAATATATA TACAACTATT AAATCCCATA AGATTGCAGA GCACATAAGT AAATTTTTTT 240 

AGAGCTTGAG GTTTGTTTAG CTTAAGCAAC CCATGAGCTC AAACACTTCC TGTTCACATA 300 

ACACTACAAA TCGCATTATG TTGCTTAATC TTATGTTTAT ATAAATTACA CACAATAAAT 360 

AGAAAGAATG TGAACATCAT GAATAAATTA TTGCTACTCG TTACATTTAT CATTCGTGTG 420 

GGTTCAGGTA TTGTTATGTT AATGCAAGGC TACGAAAAAT TAACGGGCGG ATTTACGCTG 480 

AAAGGTTTAG TACCAGTCAT CGCTAACAAT ACTGATTCAC CAGAGTGGTA TAAGTGGTTT 540 

TTCGCAAATA 7AGTTGCACA TACGACGTCA TTATTTGATA TTGTTGTCCC ACTCGGAGAG 600 

ATTGCAATTG GATTAGGTTT AATTTTTGGA GTTTTTGCAT ATGCTGCTAG TTTCTTTGGA 660 

GCCTTTGTTA TGATAAATTA TATCTTAGCA GATATGATAT TTACGTATCC TCTTCAATTA 720 

ACnrCTTTA TCCTTTTACT AATGAGTCAC TCATTGTTAA AACAGATTTC ACTTAAAGAA 780 

ATCATTAATT ACTTTAGAGG TCGTAAGAAC AGAGGTGAAA AAATAGATGA CCCACTTACT 840 

35 GATCGTGGAT GATGAACAAG ACATTGTAGA CATTTGTCAA ACCTATTTTG AATATGAAGG 900 

TTACAAAGTA ACAACGACAA CTAGCGGTAA AGAAGCAATT TCTTTACTAT CAAATGATAT 960 

TGATATCATG GTACTTGATA TCATGATGCC AGAAGTTAAT GGTTACGACA TTGTCAAAGA 1020 

AATGAAAAGG CAAAAATTAG ATATCCCCTT TATCTATTTA ACTGCCAAAA CACAAGAACA 1080 

TGATACCATT TACGCCTTAA CTTTAGGTGC AGATGACTAT GTCAAAAAAC CATTTAGTCC 1140 

AAGGGAACTC GTTTTACGTA TTAATAATTT ACTTACAAGA ATGAAGAAAT ACCATCATCA 1200 

ACCAGTTGAA CAACTGTCGT TTGATGAATT AACACTTATT AACTTAAGTA AAGTtGTGaC 1260 

tGTAAaTGGT CACGAaGTCC CTATGCGTAT TAAGGAATTT GAGTTATTGT GGTATTTAGC 1320 

TTCTaGAGAA AATGAAGTTA TTTCTAAATC AGAATTACTT GAAAAAGTTT GGGGATATGA 1380 

CTATTACGAA GATGCTAATA CCGTGAATGT CCATATACAC CGTATTAGAG AnAAATTAGA 1440 

AAAAGAGAGC TTTACAACAT ATACCATCAC AACTGTATGG GGATTAGGAT ATAAATnTGA 1500 
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(2) INFORMATION FOR SEQ ID NO: 499: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1623 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 499: 
ATTGAAAGCG ATAATTCGTA nTAATTGAGT TTGTTGAAAA ATTTAGGGTA ATGTAAAGAT 
ATAAAAGATA CATAGAyTGG AGAGATATAA AGATGTTGAA TGAGATACAA ATATTAaATA 
aTGGATACCC GATGCCTTCA GTTGGGTTAG GTGTTTATAA AATCTCTGAC GAAGATATGA 
CTAAAGTTGT AAATGCTGCA ATTGACGCAG GCTATAGAGC GTTTGATACA GCATACTTTT 
ATGATAATGA GGCTTCACTA GGACGAGCAT TAAAGGATAA TGGCGTCGAT AGAGAAGATT 
TGTTTATAAC AACGAAGTTA TGGAATGACT ATCAAGGTTA TGAGAAAACA TTCGAATATT 
TCAACAAATC GATTGAAAAT TTACAAACTG ATTATCTTGA TTTATTTCTA ATACATTGGC 
CTTGTGAAGC AGATGGTCTA TTTTTAGAAA CATATAAAGC TATGGAAGAA CTTTACGAGC 
AAGGTAAGGT AAAAGCAATA GGTGTATGTA ATTTTAATGT TCATCATCTA GAAAAATTAA 
TGGCTCAATC AAGTATCAAA CCAATGGTGA ATCAAATTGA GGTACATCCA TATTTTAACC 
AACAAGAATT ACAAGAATTT TGTGATCGTC ACGATATTAA AGTGACTGCA TGGATGCCTT 
TGATGAGAAA TAGAGGACTA CTAGACGACC CTGTCATTGT TAAAATTGCT GAAAAATATC 
ATAAAACACC AGCACAAGTT GTATTACGTT GGCATTTAGC ACACAATAGA ATTATTATTC 
CAAAATCTCA GACACCTAAA CGCATTCAAG AAAATATAGA TATTTTAGAT TTTAATTTAG 
AATTAACAGA AGTAGCTGAA ATTGATGCTT TAAATAGAAA TGCAAGACAA GGTAAAAATC 
CAGATGATGT GAAAATTGGG GATTTAAAAT AACTGGATGT TAAATTTTAC GTTTATGAAT 
GCCTTTTAAT GTGTACATTA AAATAAATGA GTTGGTTTTT ACTATTTGAT AAAACAATAC 
TCAGGTACAT TCAAAATCTT TTAAATAAAA AGGATGGACA TAGATGAAAA TTAGAGTCGT 
CATTCCTTGT TTTAATGAAG GGGAAGTCAT TACACAAACA CATCAACAAT TAACTGAAAT 
ACTTTCACAA GATAGTAGTG TGAAAGGCTA TGATTATAAT ATGCTTTTCA TAGATGATGG 
TAGTACGGAT ACCACTaTAG ATGAAATGCA ACATCTTGCC ACAATAGATA GGCATGTCAG 
CTTTATTTCT TTTAGTAGAA ATTTTGGAAA AGAAGCAGCT ATGATTGCAG GTTACCAGCA 
TAGTACTGAA TTTGATGCAG TCATCATGAT AGATTGTGAT TTGCAACATC CACCTGAATA 
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TAGAAGTGGT GAAAATTTTA GTCGCAAAAC ATTAAGCCAT TTGTATTATA AGTTAGTTAA 



1500 



TTGCTTTGTA GAAGAAGTAC AATTTGATGA TGGTGTTGGT GATTTTAGAC TTTTAAGCCA 



1560 



AAGAGCTGTT AAATCCATTG CATCACTTGA AGAATATAAT CGnTTTTCAA AAnGGnTATT 



1620 



TGA 



1623 
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(2) INFORMATION FOR SEQ ID NO: 500: 
(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 605 base pairs 

(B) TYPE; nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 500: 

AAAGTnGGTG AAnCTATATA CTTAATCTAT ATTTATATAT TAACCATTAG GGTTAAAAAT 60 

TACTCTAGCA TTTATGAATA GATGGGAGTT TATTTTATTA TTATATAGGA GAGATGTTGA 120 

ATGACACATC GCGCACTATT AGTTGTTGAC TATTCATATG ACTTTATCGC AGACGACGGC 180 

TTACIAACAT GCGGTAAACC TGGACAAAAT ATTGAAGATT TTATTGTTTC TCGTATCAAT 240 

GACTTTAATT ATTATCAAGA CCATATATTC TTTTTrrTGG ATTTACATTA TTTACATGAC 300 

ATTCATCATC CTGAAAGTAA ATTATTCCCA CCACACAATA TCGTAGATAC AAGTGGTAGA 360 

GAATTATACG GTAAAGTAGG TAAATTATAC GAAACAATTA AAGCGCAACC TAATGTACAT 420 

TTCATTGATA AAACGCGCTA TGATTCGTTC TTTGGTACCC CGCTTGATAG TTTATTGAGa 480 

GAAAGAAGTA TTAATCAAGT CGAAATCGTT GGTGTATGTA CCGATATTTG CGTGTTACAT 540 

ACAGCAATTT CTGCATACAA CTTAGGtTAT AAAATTTCAG TACCTGCTGA GGGAGTGGCT 600 

CATTT 605 
(2) INFORMATION FOR SEQ ID NO: 501: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1739 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 501: 
TAGGTTnAAA GCATAGnTTT nTCAAAAAGA CAAATCATTC ATATATTGGA GGATATTTTG 60 
GTGTAAGATA TAGTGCAACC ACAATTGCTA AAGACTTGAA GGAACTAAAT ATATATCGTG 12 0 
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TGAGAGAAAA GTTTAGACAC 


TATTGTGAAC 


ATGAAGTTCT 


AAGTTCAATC 


ATCAATGGTT 


240 




CATACATTAT 


CGTCAAAACC 


TCACCTGGTT 


TCGCCCAAGG 


CATAAACTAT 


'rriATCGATC 


300 


5 


AGCTAAATAT 


AGAAGAGATA 


TTAGGTACGG 


TGAGTGGAAA 


TGACACTACA 


TTAATCTTAA 


360 




CTGCCTCAAA 


TGATATGGCA 


GAATACGTAT 


ATGCAAAATT 


ATTTAAATAG 


ACATGTATCA 


420 


10 


AATGAATAAT AAAAATTTGT 


TTCGTATCAC 


GTGTACTCAA 


GTTAGTTACC 


AAATATTAAC 


480 


TTGTGTACGC 


GTTTTTTi'AT 


GGAAAGAAAG AATTCATAGT 


CATTCAATTG 


ACTGTATAAA 


540 




AAACTTTATA 


CAACATGTTT 


TTATGGGTAT 


TTTTGAATAA 


AAAATGTATA 


TTTTGACCCA 


600 


IS 


AAATACCTTT 


ATTTATGTAT 


AAAAATCCAT 


TATTATGTAT 


TGTATAACAA 


AAAGATATGA 


660 




AATTTTCGAC 


TTTCTTTATG 


TGAATATAAT 


CACATGTAAG 


CGTTTGAAGA 


TTGTCTATAC 


720 




TCTAAATGAA 


TTCAAAGATA 


AAAGGAGGAA ATAGACATGA 


CAGATGGTCC 


AATTAAAGTA 


780 


20 


AATAGCGAAA 


TTGGAGcrrr 


AAAAACTGTG 


TTACTTAAGC 


GTCCTGGaAA AGAATTAGAA 


840 




AATTTAGTAC 


CTGATTATTT 


AGATGGATTA 


cTA'rrrGATG 


ATATTCCATA 


TTTAGAAGTA 


900 




GCTCAAAAAG 


AGCATGACCA 


TTTTGCGCAG 


GTGCTAAGAG 


AAGAGGGTGT 


TGAAGTACTT 


960 


2S 


TACCTTGAGA 


AGTTAGCAGC 


TGAAAGTATT 


GAAAATCCTC 


AAGTAAGAAG 


TGAATTTATT 


1020 




GATGATGTAT 


TAGCAGAGTC 


TAAAAAAACA 


ATATTAGGTC 


ATGAAGAAGA 


AATTAAGGCA 


1080 


30 


TTATTTGCGA 


CACTTTCTAA 


TCAAGAACTT 


GTAGATAAAA 


TAATGTCAGG 


GGTACGTAAG 


1140 


GAAGAAATTA 


ATCCX3AAATG 


TACACATCTA 


GTAGAGTATA 


TGGATGATAA 


GTATCCATTC 


1200 




TATTTAGATC 


CAATGCCAAA 


ccrrrATTTT 


ACTAGAGATC 


CACAAGCCTC 


AATAGGACAC 


1260 


33 


GGTATAACAA 


TCAATCGGAT 


GTTCTGGAGA 


GCACGACGAC 


GAGAATCAA7 


ATTTATTCAA 


1320 




TATATTGTAA 


AGCATCATCC 


TAGATTTAAA 


GATGCGAATA 


TTCCAATCTG 


GTTAGATCGA 


1380 




GATTGCCCAT 


TCAATATTGA 


AGGCGGCGAT 


GAACTTGTTT 


TATCTAAAGA 


TGTCTTGGCT 


1440 


40 


ATAGGCGTTT 


CAGAACGTAC 


ATCTGCACAA 


GCTATTGAAA 


AGTTAGCGCG 


ACGTATTTTT 


1500 




GAAAATCCGC 


AGGCGACGTT 


TAAAAAAGTA 


GTAGCAATTG 


AAATTCCAAC 


TAGTCGAACT 






TTTATGCACT 


TAGATACAGT 


ATTTACAATG 


ATAGATTATG 


ACAAATTTAC 


AATGCATTCA 


1620 


45 


GCCATFITAA 


AGGCAGAAGG 


CaATATGAAT 


ATATTTATTA 


TTGAATATGA 


TGACGTAAAT 


1680 




AAAGATATTG 


CCATCAAACA 


ATCTAGTCnT 


TTAAAAGATA 


CTTTAGAAGA 


CGTACTAGG 


1739 




\2) INFORMATION FOR SEQ ID NO: 502: 









SO 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 174 5 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDSDNESS: double 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 502: 

^ CTGTACATAC AGCAATATCG TTAACAAATG AAAACAGTAT TTTAGGATTG TAAACCATGA 60 

TAAACCTAAA ATACTGTTAT TTriATTACT TAAATTTCTT CTTCAATGCC TTTTCAACAT 120 

AAGGTGGAAC GAATTCAGAA ATATCTGCTC GATAAGCTGC AACTTCTTTA ACAATACTTG 180 

10 

AACTTATAAA TGAATAATTA GTACTAGACA TCATATATAA CGTTTCAATT TCATTGTTCA 240 

ACTTTTTATT CATTGAAGTT AAGCGTAATT CATATTCAAA ATCACTGACT GCTCTTAAAC 300 

CACGTATGAT TGTTTTAGCT CCTACTTGTT CACAATAATC GACTAGTAAA CCACTAAATT 360 

75 

GATGAACCTT GACATTAGGT AAATGTTTAA CAGATTGTTC AATTAAATCC ATACGCTCTT 420 

CTAAACTAAA CGTACCTTCT TTTTTACTAT TTTTAAGAAC ACAGACATGA ATTTCATCAA 480 

20 ATCTATCTGT ACTTCTCTCA ATAATGTCTA AATGACCATA AGTAATGGGG TCAAAACTAC 540 

CCGGAATGAC CGCTATTGTA TGTTCCATGC TATTCTCCCT TTTCTAATAA CAATGTGTCT 600 

GTCAACCCAT AATGGTAACG TTTAATCATA TTAAACGGTT GATAATCtAT TTCTTCATGA 660 

25 TTGCTAAATT CACAAACGAT GATACCATTT TCTTTCAATA AATTAAACTC TGAAATTAGT 720 

TTTAAAGCTT TATCAATGAG ACCTTTATTA TAAGGTGGAT CTAaGAAAAT GACATCAAAT 730 

TGAATATCAC GTTTTGACAA TGCTTTTAAA GCTCTATCTG CATTATTTTT ATAAACTTCA 840 

30 

GATTGTGCCT CTAAATCCAA ATTCGCAAGA TTTGaTTTAA TAACTTTTAC AGCTTTAAAA 900 

TTTTGaTCAA CAAAGATTAC CTTATCCATA CCTCGAGAGA GTGcTTCTAT TCCAAGCGCC 960 

CCGCTTCCTG CAAATAAATC TAAACCTATA CCTGACACAT CATATAAACT ATTAAAGATA 1020 

35 

CCTTCTTTAA CTTTATCCAT AGTTGGTCTC GTATTACGGC CTTCCATACT TTCTAAAGCT 1080 

TTACTTTTAT GTTTACCTGC AATGACGCGC ATGTTGTTCA CACTTCCAAT TCATTTAGTT 1140 

ATTTAATATA ATTTATTGAG AAAAAGGAGA ATGATAAACC AATGAAACAA ACATTTATTA 1200 

CACTTGGTGA AGGTCTAACA GATTTGTTCG AATTCATGAC GATGATTGAA TATAACCATC 1260 

AACGTATTGA TAAAATTATC TATTTTCATT CACCACAAGC TGAAAATAAA AAGTCATCTG 1320 

45 TAGCAATCAT TATGAACCCT ACAACTGGCA ATCATTTCCA AGCATTTTAT ATCATGATAA 1380 

ACGCTATTAA ATATCCATAT CCAGATTCAA ATAAAAAGTT TCAAATGATA AATGATTGTG 1440 

CTGAAAAATT CGACATACCA ATTTTAGGTA TCGATGTACA GCCCCCTCAA GCATTTCATG 1500 

50 

ATTTATCGTT ATATTATAAT TATTTAATTA GTGTGTTAAG GCTCCAAAAA TGGATACCAG 1560 

aACTTCAATA ATATTAATTA TATATTTCGT GTTTCTCTTT TTCGTAAGTT TTCTTTAAGT 1620 
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TTTGATCAAC ATCTTGCTCA TTCACATACA TAATTACAAA TTTACGATCT CTATTTGAAT 1740 



GAACG 

5 

(2) INFORMATION FOR SEQ ID NO: 503: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1035 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: doiible 

(D) TOPOLOGY: linear 



25 



30 



35 



45 



SO 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1284 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 



1745 



75 (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 503: 

TCGTCTTTAA TCTTGCTGAC TTTAGAAGGC TTACGAGTGC GGTTACCATT TTTTGCATCT 60 

TTAACT8ATT GAACTAAAGC TtGACGTGTA GATTTATCAG CTAAACTAAT TGCACCACCA . 120 

20 ATTACGGCAC CAATTAAAAT ACCAGGAACA AATTTATTTT CCATAAAAAA CTACCCCTCT 180 

TTCAAATTTG CATCTTTTAC GATGTAGTCT ATTAAATTAT CACAAGATGA TAATACCATG 240 

TCGTATACAC CTTCAAAATT ATTCGTGTAG TATGGATCTG GTACATCACT CTCTTCCATA 300 

TTACTAAATT CTAACAGTTT GAACAATTGT CCCTTAAGAT TAGGATTGAT AGATTTAATA 3 BO 

TTATCAACGT TACTTTGATC CATAGCCACA ATGTAATCAA AATCATCTGT CGCTTCGAAT 420 

AATTCACTAA TCATGCCATC AAATGGAATA TTGTGTTTGT TGAGAATTTT TTGTGTACCT 4 80 

TCATGAGGTG GCTCTCCTAA ATTCCAGCTA CCAGTACCTC TTGAATGTAC TTTAATATCA 54 0 

TGAATATTTC TGTCTTTAAG TCTTTGTCGC ATGATTGCTT CTGCCATTGG AGAACGACAT 600 

ATATTGCCAA GACAGACAAA TGCTACATCT ACCATTTTGA TTCCTCCAAA CTATGTAGTT 660 

ATATCCCCAT TTTATAGCGA CTTTAAACAA TAAGAAAGCA GATTATATAA AATTCTATTA 720 

AAGTTTATTA AATTGTGATA CTTTGATAAC ATAACTATTA TTAGAGGTGA ACATTGTGGC 780 

40 TATGACAAAT GAAGAGAAAG TnTTAGCTAT TAGAGAGAAG TTAAATATtG TTAATCAAGG 840 

ATTATTAGAT CCTGAAAAAT ATAAAAATGC AAATGaAGAA GAATTAACAG ATATATATGA 900 

TTTTGkTCaA yCAAGAGaAA GATTGTCGCC AAGTGaAGTG mCAGCTATTG CTGaCGCTTT 960 

AGGACAATTG CGACACGAAT AGGAGTGGGA ATTTTGACTA ATTACAAAGA AAAGTTACAA 1020 

CAATACGCTG AACTA 103 5 
(2) INFORMATION FOR SEQ ID NO: 504: 
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10 



IS 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 504: 

AnCCTGACAA GATTCTTATA TTCATAGATA TGAGAGCTAA AAATGAAATC AACAAACAnA 60 

CAATAAAGTA AACGATAATA GCCCATATAC CATTTTGTAA CCATATTACA AATTGTGTTG 120 

TATTATAGCC ATTTCCAGCT AATAATTGCT GGATAAATGC ATTATTGTTT AATGTATTTT 180 

CAAGATTAGC AAtCGATGTG TTATTACTGA ATGAAACAAG TGCTATAAAC ATCGTAATGA 240 

CAGTAAGCAC TAATAACATC ACCCAACATA ACCAACCTAG AACTTTTTCA GTTAATCTAC 300 

TTACTGGACG TTTAATTTGA GTAAATTGTT CTCCAGTCAT TCGTTACAAC TCCTTATAGT 360 

ACTTATCCCG TTATTATAAC TAAATATACA GTAAATAACT ACTATTTATG ATTTTATTTT 420 

AATGACATTT TGAAATTCAA AAAGTTTTCA TTGTATTCAC TTAAAACTTC AGGTCCTAAA 480 

20 TCTTTATAAA CTTCAAGGCG TTCTTGCTCT TTCTTAGTCG GATAAAAACG ATGGTCGTCT 540 

TTAATCTCTT TAGGCAACAA TTGTCGAGCA GCCTTGTTTG GCGTTGCATA GCCTACGAAT 600 

TCTGTATTTT GCTTGTTATT TTTAGCATCT AATAAAAAAT TCATAAATTT ATATGCACCC 660 

25 TCTTTATTTT GTGCCGTTTT TGGAATTACC ATATTGTCGA ACCATAAATT CGATCCTTCT 720 

TTAGGAATAA CATAATTATA TTTATCCCCT TCTTGCACTA GAGGTGCTGC AACACCACTC 780 

CAAACAACCG CTATGTTACC TrCATTTTGT TGAAGCATCA TGGTAATTTC ATCACCTACG 840 

ACACCTCTTA CTTGTGGTGC TAGTTTGGTT AAATCTCGCT CTGCTTCTTT TAAATGGTGC 900 

GAATTACGGT CATTAAGATT ATACCCAAGT TTATTCAAAC TCATGCCTAT AATCTCTCTA 960 

GCACCGTCAA CTAGTAAAAT TTGGTTTTTA AATTTAGGAT TATACAATGA CTTCCAACTA 1020 

TCAAATGATT CATTTGGATA CTTTTCTTTA TTATATAAAA TACCTACAGT TCCAAAGAAA 1080 

TAAGGTAAAG AATATTTATT GCCTCTATCA AATGACATAT TCATATAATC TGAATCTAAA 1140 

TTTTTAATAT TAGGTACCTT ATTATGATCT ATTGGTAACA ATAAATGATC TCTTTTCAAT 1200 

TTTTGAACTG nATATTCACT AGGAnAAGCA ACATCATAAT GTGTACCGCC AGTGCGAATT 1260 

TTGGnGTCCA nCGCTTCATT TGAA 1284 
{2) INFORMATION FOR SEQ ID NO: 505: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 5763 base pairs 

(B) TYPE: nucleic acid 
so (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 
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ATAATTAACA TCTTTTGCTA TATACCACCA GTTTGATACA TAAAATATCG CAGCAATAAT 60 

ATCATGTTTA ACCCTAATGA TATTATCTGA TTTTAATAAT AAGGTTGCTG TCCCTACAAC 120 

5 

CATTAATAAA ACTATGACTG CTGGTAATAA ACGTTTTAAA CGACGTATCC AAAAGCTTTT ISO 

CAATTTAATG ATACCTGTGT CATCATACTC TTTGAGTAAT AAGCTTGTAA TTAAATAACC 240 

AGAGATCACA AAAAATGTAT CCACACCTAA AAAGCCACCT GtCAACCATT GCTTATTTAA 300 

10 

GTGGTAAATA ATAATTCCTA GAACAGCGaT TGCCCTCAAA CCATCGAGCC CTGGAATATA 360 

TCTCATTTTC TTATACTTTG TAAAACCCTT TGTTTTGTTC ATTTTTGCAT TCTTCCCTTT 420 

75 TAAAACTGTT CTTCTTAGAT GCTTAATTAA ATTTAGTTAT GCTGTTTAAA AGAATATTGA 480 

AATGCATATG TATATTATTG AATTACGACA TCATCAAAAT CATATTGACT AAAATACTGT 540 

TAAATTAAAA AAATTACCAA TGATGATTCT TACTTCGAAA TCCAATTTGT AATGCAACTC 600 

20 GGCAACTTAA AAACTATGAA GTATTATGTA TTGTAATATA ACTGTAATAT AAATTCAATT 660 

TATTATAAAA ATTTTCAAGA AAATATTCAA CTAGAAAATG AATTGTGCAC TCTTGGAAGT 720 

GCAAGTCACT GTCTTAATTC ATATTTTTTG AAACAAGTTA GATATAAATT TTCAAAATAA 780 

25 

AATCAGAAAC TAGAACATAA ATAAGGCTCC CTTCAAAATT TTCATTTTTC AATGTCTACT 840 

TTGAAGGGAG CTTATTCACA ATGAATTATA CTCTACAATG TTATATTGAC TGCGGGCCCA 900 

AACACAGAGA ATTTCGAAAA GAAATTCTAC AGGCAATGCA AGTTTATGTT AGCTCACACC 960 

30 

AAGTGCAATC TTAGCGTAAC GTGACATCAT ATCTTTTGTC CAAGGTGGAC TCCATACGAT 1020 

ATTCACTTCA GTATCCTGAA TTTCAGGAAT CTCTGCTAAT ACTGTTTTAA CTTGaTCAAT 1080 

AATTTGAGGT CCCATTGGAC ATCCCATTGA TGTTAAAGTC ATATCAACTG TACATACGCC 1140 

TTCATCATCA ACATTCACTT TGTATACTAA ACCCAAATTA ACGATATCAA TTCCTAATTC 1200 

AGGGTCAATT ACCATTTCTA ATGCACCTAA GATACTATCT TTCAATGCCT CTTCCATCCA 1260 

40 TATCACCTCT TTAATGTCAT ATTATTCATA ATATATCAAA TATCCGACAA AACGCCAATA 1320 

AAATGCTATG ATGTATCTAT ATGAACTAAG CAACTTATGA GGAGAGAGAT ATGCAACCAC 1380 

ATTTAATATG TCTAGACTTA GACGGAACAT TATTAAACGA TAACAAAGAA ATTTCATCAT 1440 

45 

ATACTAAACA AGTATTAAAT GAATTACAAC AACGTGGaCA CCAAATTATG ATTGCGACTG 1500 

GCAGACCTTA TCGTGCAAGT CAAATGTATT ATCATGAATT AAATTTAACG ACACCAATTG 1350 

TTAATTTTAA TGGCGCTTAC GTACATCACC CTAAAGATAA AAACTTCAAA ACTTGCCATG 1620 

SO 

AAATTTTAGA TTTAGGCATC GCACAAAACA TTATTCAAGG ATTACAACAA TATCAAGTAT 1680 

CGAATATTAT AGCAGAAGTG AAAGATTATG TTTTCATTAA CAATCATGAT CCAAGATTAT 1740 
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10 



15 



20 



25 



30 



35 



40 



45 



SO 



AAGAATCCCC 


TACCTCAATT 


TTAATTGAAG 


CCGAAGAAAG 


TAAAATACCT 


GAAATCAAAA 


1860 


ATATGCTTAC 


TCATTTTTAT 


GCCGATCATA 


TTGAGCATCG 


ACGCTGGGGC 


GCACCATTCC 


1920 


CTGTCATTGA AATTGTAAAA 


CTTGGTATTA 


ATAAAGCAAG 


AGGCATTGAG 


CAAGTTAGAC 


1980 


AATTTTTAAA 


TATTGACCGA 


AATAATATTA 


TTGCATTCGG 


TGATGAAGAT AATGATATTG 


2040 


AAATGATTGA 


GTACGCGCGT 


CACGGTGTTG 


CTATGGAAAA 

A * • 4» mm mm mm m 


TGGTTTGCAA 


GAACTTAAAG 


2100 


ATGTAGCGAA 


CAATATTACA 


TTCAACAATA 


ATGAAGATGG 


CATTGGTCGA 


TATTTGAATG 


2160 


ATTTCTTTAA 


TTTAAATATT 


AGATATTACT 


GTTAATTTAT 


AACTAATCAT 


TTTATAATAT 


2220 


TTTAAAACAA 


TAGGAGGTAA 


GTTACGATGC 


CCAAAATAGT 


CGTAGTCGGA 


GCAGTCGCTG 


2280 


GCGGTGCAAC 


ATGTGCCAGC 




GTTTAGATAA 


AGAAAGTGAC 


ATTATTATTT 


2340 


TTGAAAAAGA 


TCGTGATATG 




ATTGTGCATT 


GCCTTATGTC 


ATTGGCGAaG 


2400 


TTGTTGAAGA 


TAGAAGATAT 




ATA rjvrrTG A 


AAAATTTTAT 


GATAGAAAGC 


2460 


AAATTACAGT 


AAAAACTTAT 




TTGCAATCAA 


TGATGAAAGA 


CAAACTGTAT 


2520 


CTGTATTAAA 


TAGAAAGACA 


AACGAACAAT 


TTGAAGAATC 


TTACGATAAA 


CTCATTTTAA 


2580 


GCCCTGGTGC 


AAGTGCAAAT 


AGCCTTGGCT 


TTGAAAGTGA 


TATTACATTT 


ACACTTAGAA 


2640 


ATTTAGAAGA 


CACTGATGCT 


ATCGATCAAT 


TCATCAAAGC 


AAATCAAGTT 


GATAAAGTAT 


2700 


TGGTTGTAGG 


TGCAGGTTAT 


GTTTCATTAG 


AAGTTCTTGA 


AAATCTTTAT 


6AACGTGGTT 


2760 


TACACCCTAC 


TTTAATTCAT 


CGATCTGATA AGATAAATAA ATTAATGGAT 


GCCGACATGA 


2820 


ATCAACCTAT 


ACTTGATGAA 


TTAGATAAGC 


GGGAGATTCC 


ATACCGTTTA 


AATGAGGAAA 


2880 


TTAATGCTAT 


CAATGGAAAT 


GAAATTACAT 


TTAAATCAGG 


AAAAGTTGAA 


CATTACGATA 


2940 


TGATTATTGA AGGTGTCGGT 


ACTCACCCCA 


ATTCAAAATT 


TATCGAAAGT 


TCAAATATCA 


3O0O 


AACTTGATCG 


AAAAGGTTTC 


ATACCGGTAA 


ACGATAAATT 


TGAAACAAAT 


GTTCCAAACA 


3060 


TTTATGCAAT 


ajggcgatatt 


GCAACATCAC 


ATTATCGACA 


TGTCGATCTA 


CCGGCTAGTG 


3120 


TTCCTTTAGC 


TTGGGGCGCT 


CACCGTGCAG 


CAAGTATTGT 


TGCCGAACAA 


ATTGCTGGAA 


3180 


ATGACACTAT 


tgaattcaaa 


GGCTTCTTAG 


GCAACAATAT 


TGTGAAGTTC 


TTTGATTATA 


3240 


CATTTGCGAG 


TGTCGGCGTT 


AAACCAAACG 


AACTAAAGCA 


ATTTGACTAT 


AAAATGGTAG 


3300 


AAGTCACTCA AGGTGCACAC 


GCGAATTATT 


ACCCAGGAAA 


TTCCCCTTTA 


CACTTAAGAG 


3360 


TATATTATGA 


CACTTCAAAC 


CGTCAGATTT 


TAAGAGCAGC 


TGCAGTAGGA 


AAAGAAGGTG 


3420 


CAGATAAACG 


TATTGATGTA 


CTATCGATGG 


CAATGATGAA 


CCAGCTAACT 


GTAGATGAGT 


3480 


TAACTGAGTT 


TGAAGTGGCT 


TATGCACCAC 


CATATAGCCA 


CCCTAAAGAT 


TTAATCAATA 


3540 
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GTTAGAATTA TGTTGGACTG GTACTACTAT CCAGTCCATT TTTTATGTTT AACATTTTTA 3660 

6AATCAAAAA AGACATAAGG TCTTGGACTA ATAATTGTCC ATGCCTTATG TCATATACTA 3720 

5 

TATGTCTTAT CAATTAGCCA ATACCGAATA ATTTTGATAT AGGsCCTAAC GGTAGAATGA 3780 

CACCTAATAC CATTGTGATG ATAATTAATG CAATTGTTAT CCAAAACATT GTGTGACTTT 3840 

GTTCATGTCT CTTTCTTTTA GCAATCGACA CTTCCATCAA TCCAACTACT GCAACACCAC 3900 

10 

ACAGCATTTT CAATGTAAGC AACATATGAT TTGCCCCGCC ATTCATAAAT GACTGAATTA 3960 

ATATCCAAAA TCCTGAAATT AACGTCAACA GCATAAATAA GCGTAAAATC ATGTGCAACG 4020 

^5 GTTTGAAAAA TGGTGATCTG CCTTGATTTT TTGAAATGTT TAAGTATGTA GCGATAAATA 4080 

AAATAATCGC TAATACCCAA CTTAATATAT GTAAATGTAA CATACTGATT CCCCCCACTT 4140 

TAATTATTTA TATTATTAAA TTAAAGCTTC TTGGGATTAA TACCCACTTG CTTGTAATTT 4200 

20 AATCATGATT TGATTATACA CGAATATATA TTCTACCACA CTTCTATATT TGAGAGGAAG 4260 

AACATGACAT TTTATTCCTT ATTAGAATAT TGTGAATCTG CTGTAAAATA ATCAACTACT 4320 

TCTTAATATC AATATTTCAC TTTCATCTCA AAATGGTAAC ATTATAAATA ATTTATCTTT 4380 

2S 

AACACCTTTT TAGAAAAGCA AGAAAAAACT AACCAATCTA TATAAAGACT GGTTAGCTTT 4440 

TTAAATGATA ATTATTTAGC GATATAAGTT GTCAGCGTTC CAATATTATC AATAGTCACT 4500 

TTAACTTCAT CACCTGGTTG TAAAAATTTA GGTGGTTGCA TACCTGCACC AACGCCTGCT 4560 

30 

GGTGTACCAG TTGCAATAAT ATCTCCCGGA TGTAGTGCAA CATATTTTGA AATTTCTTCT 4620 

ATTAATTCAT CAATTTTAAG AATCATTTCG CCAGTGTTAC CATCTTGTCT AATTTCATTG 4680 

TTAACTTTTG TAACAATATT TACATTTXCA GGTAATGGTA GTTCGTCTTT AGTAACGATA 4740 

TAAGGACCCA TTGGGCAACC GCCAGTTAAA CTTTTTGATA AAAATGCTTG ATCTTGTTCA 4800 

CTTTGTGCTT TGCGATCAGT GATATCXJTTA ATAATTGTAT AGCCX3TAAAC ATAATCTAAA 4860 

40 GCTAATGCTT TTGGAATCTT TTCACCAGAC TTACCAATAA CAATACCTAA TTCACCTTCA 4920 

TAATCTAATT GATCAGTAAT ATCTTTATGA TTTGGAATTG TTGCATTATC TCCTGTTAAA 4980 

GATGACGCTG CTTTTGTAAA TACATATAAT TTTTCCACTT CATGATTTAA TTCGTTCGCA 5040 

45 

TGATCTTTGT AATTTCTACC AAAAGCAATC ACATTATTCG GAGGTGTTAC TGGTGGTAAA 5100 

AATTCAATGT CATTAAATGA AATTTTArAG TCTTCAGCTT TGCCGCTATC TTCTGCTGCT 5160 

ACAACTGCTT TACGTACTTG TTCTTGAAAA TCTAAAGTAT GATTTTGTTG TAAACCAGCT 5220 

SO 

AACAATGTTT TAGGATGGAA ATCTCCTTCT GCAAAGTCAG CAAATACTTG TGTTAAATCC 5280 

CATACAGCAT CTTCGCGTTT TACTTTAACG CCATATGAAG TTTTGTCATT ATACTTGAAT 534 0 
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TO 



TTCGTTATCA AATAACAAAT AAATAAGTAA GACAATTTTG AAAATGAGTT GTGTTCATTC 54 60 

TGCTACAAGG ACTTTGCACT TAATCGAAAT TATTTTTTAT TCTTTTGAAA ATCAAAATAC 5520 

TATAGTTGCA ATGTACCAAA TTTGAAGAAG TATAAATAAC CTTTAACTTC TTTATTAAGA 5580 

ATCGTTTGAA GCGTATTTTG ATAATATTTC ATCTGTATCT TATATTTATT TTTTAATTGT 5G40 

GTACCAATTT CTTCATCTGT CATCCCACGG CGACGATTAA ATGCATCGGT TTTATAGTCT 5700 

ACAAAATAAT GCACACCATC TTTAACAAAG ATTAAGTCAA TCATACCTTG AATAATTGAG 5760 

ACG 5763 
^5 (2) INFORMATION FOR SEQ ID NO: 506: 

(i) SEQU3NCE CHARACTERISTICS: 

(A) LENGTH: 422 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : doxible 

20 (D) TOPOLOGY: linear 



25 



30 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 506: 

CCATATGATT TTGTGCAATA ACTCTTTTTC TTTCTTCTTT TCGTAAAAAG TTGTACATCG 60 

CTTTTGTGTT TAAGAGACTA TTGTTTTCTT TAGGTTTTTG AACTTCACTC AGTGTATTTC 120 

TAGTTGTTAA CACTAAAATT CCAACTGTTG TATCTTTGTA TCTAGCCATA ACTTTATTCA ISO 

GATGTTTGTC ATTTGTAATA ACTACGACAT AATTAAACAC TTCATAATAA TCATTAATTT 240 

GATTATCTAA TCTATCCAGC TTATCTAATT CTGTTTTAAT CTCATAGACA ACGCCTTTGC 300 

CGTTTAACAA TATAAAATCA GCaATACTTT TCCCTATGGG CATCTCAGAA AGTGCAGTAG 360 

TTGTATTAAT AGAATGTCGT CCTAGAAGGA GTkTATTAAG TATnGTGTTT TTGTAAAAAT 420 

AT 422 
40 {2) INFORMATION FOR SEQ ID NO: 507: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1188 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 
^ (D) TOPOLOGY: linear 



35 



SO 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 507: 
GCTTATGTAT TCTCAAAATA TTTATGTGAT ACGCAAAGGA GACATGGTTA TTCGACCAGC 60 
ATTTGATGAT GACGATCAAA GAAACGGTAG TGAAATAATT CGGTTTGACA AAACGCGTAT 120 
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TTATCTTGGC AAGAAAGCAG AGACAAACCG CATTACTGGC ATTTCTAGTA AACCACCTAT 240 

TTTACTAACA CCATTATTTC CAACTTATTT TTTCCCAACA CATTCTGACA GACAAAATGA 300 

AAATATTTGG TTAAATATGC ATTATATCGA AAGTATTAAA GAATTAAAAA ATCGTAAATG 360 

TAAAGTGACA TTTATTAATA ATGAATCAAT CATTCTTCAT GTTTCATACC ACAGTTTATG 420 

GCATCAATAT AACAATTCCA TTTTTTACTA TTACATGGTA GATAAACAAT CTCGCATGAT 480 

ATCAAAAAAT CCCGACCAAC CAATAGATTA TAATAAAGCC ACATTGAATG TGTTTGAAGC 540 

ATTGACACGC TATTCTTTAT TTGAAGATAA ATAAATTGTT TATTTTTAAA ATATGCGGAA 6 00 

TGTTTTATAA ATATAGTGTA AATGTTCTGC ATATTTTTTT AAGGTATCTA TTGCAAATTA 660 

ACTTAATCTT GTTATAATAA TATTTGTGCT TGaTATTCAA ACACATACAA ATTAATCCAC 720 

AGTAGCTCAG TGGTAGAGCT ATCGGCTGTT AACCGATCGG TCGTAGGTTC GAGTCCTACC 780 

20 TGTGGAGCCA TTGGAAACGT ACTCAAGTTG GCTGAAGAGG CGCCCCTGCT AAGGtGTAGG 840 

TCGCGAAAgG CGCGAGGGTT CGAATCCCTC CGTTTCCGTT ACTTGCTAAA ATGGTATATA 900 

CCATTTTAnC TTnTTGTTT ACTTATATAT AATGAATGAG AATTTCACTG TTCTTTTA7A 960 

TCAATTTTAA AATTCTAAAA ACCTTTCCTA GATAATCTTC TCTAAGAAAG GTTTTTATAC 1020 

TTGTTGAACT TATAATTAAT TTATTACATA GCAATATTTA CCTGTTTTTA ACTATAAAAT 1080 

TATCACTACA TGAAATACGA TAATTCGGaT CTCTTAACTT CTCTGCaATT AATGCACTCA 1140 

TTGgTTTCAT CGTATGATTC ATGTATAATA GCATTTkTTA AATAATTC 1188 
(2) INFORMATION FOR SEQ ID NO: 508: 



25 



30 



35 



40 



45 



SO 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 840 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 508: 

CCCAACTTCG GTTATAAGAT CCCTCAAAGA TGATGAGGTT AATAGGTTCG AGGTGGAAGC 60 

ATGGTGACAT GTGGAGCTGA CGAATACTAA TCGATCGAAG ACTTAATCAA AATAAATGTT 120 

TTGCGAACAA AAtCACTTTT ACTTACTATC TAGTTTTGAA TGTATAAATT ACATTCATAT 180 

GTCTGGTGAC TATAGCAAGG AGGTCACACC TGTTCCCATG CCGAACACAG AAGTTAAGCT 240 

CCTTAGCGTC GATGGTAGTC GAACTTACGT TCCGCTAGAG TAGAACGTTG CCAGGCATAA 300 

TATTAATCCA CAGTAGCTCA GTGGTAGAGC TATCGGCTGT TAACCGATCG GTCGTAGGTT 360 
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GGCGGTAACA CGGGTTCGAG TCCCGTAGgA GTCATACAAG CAGAAGTGAA ATATCGCTTC 4 80 

TGTTTTTTTA TTACATATTT ATTGTTGAGG AAGGTTGTCC GAGCTGGCCG AAGaGCACGC 540 

^ CTGGaAAGTG TGTAGGCGTC ACAAGCGTCT CAAGGGTTCG AATCCCTTAC CTTCCGTAAA 600 

GGcGCTTAAA TTGGTTTTAC CCATTTTAAG CGCTATTTTT ATTTTGGACT CAATCCCTTG 660 

ATATATCTGC ATTTGAGCTA TTATCCTCAT TTTTACACTT CTTATTTATT TATATCCATT 720 

10 

TAAAATTTTT TAGCCACAAT GTGACTAATT TTTGaTGAAT AATCCTAATT TTAGtCACAA 730 

GATTTTGAAG TTTAGTO^CA AAACAAATCA TTCAGATTTT TTTCyATAAA TTTAGTriCA 840 

^5 (2) INFORMATION FOR SEQ ID NO: 509: 

(i) SEQUENCE CHARACTERISTICS: 

{A) LENGTH: 1373 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
20 (D) TOPOLOGY: liaear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 509: 

2o TTCTATGAAA CTATCAGCTG TTTCTTTTTC CTTGGTAAAA ATCGTTTTAA CGCCATGATA 60 

CATGTATTCT CTTTCAaCAC CCGATTGGTC ATAAGCATCG AAAACACAAA TAATTTCATC 120 

TGAAATAACT GCATTATAAT TTGCAATTGC ATCTATTAAT TGCATTCTAG CTTCTTCTAA 180 

30 

ATTCTCTTTT GCAATGGCGC TTAGCGTTGG TGATTGTCCT ATCATATTGT ATCCATCAAT 240 

GATTAAGTAA CGTTCTTTCA TTATATTTCT CCAACATCAT GTCTTTTTCG AAATACTTCG 300 

TACATCATTA AACTTGCTGC AACCGAAGCA TTCAAACTGT TTACATGTCC AACCATTGGA 3 60 

35 

ATCTTAATAT AAAAATCGCA TTTATCACTT ACTAGGCGAC TCATACCCTG TCCTTCGCTA 420 

CCAATTACAA TAGCCAATGA CATGTCCGCT TCTAGATTTC TATAATCTGT TGCATTATTA 480 

40 GCTTCAGTGC CAGCTACCCA AAAGCCATTA TCTTTTAGTT CATCGATAGT TTTAGCTAAA 540 

TTTGTCACTC GAATAACTGG TACATGTTCA ATTGCACCTG TTGAGGCTTT TGCAACTGTT 600 

TGCGTTAGTG TAACTGAACG ACGTTTAGGA ATAATAACAC CATCAACTCC CGTTGCATCG 660 

GCTGTTCTTA AAATTGATCC CAAGTTATGT GGGTCTTCTA AGCCGTCTAA TATAAGTACT 720 

GTCAATAAAC CTTCTTTTTC TTTTTGCTGT TTTAAAAATT GATCGAAGTC AGCATATTCA 780 

TATGGTGCAA TAAGCGCTGC AACACCCTGA TGTGGTGCAT TTGCTAAAAA ATCTAATTTA 840 

SO 

GATTTTGGTA CAGITTGAAC AATGATTTTT TGATCTTTTG CATTTTTTAA AATTTCATTA 900 

ATTTGTTGCT TTTTAATACC TTCTTGAATC AATATCTTAT TTAyCGGATG CCCAGTAATA 960 
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TTCGTTTACT ATTGTTATTA TTTTATTTAA TAATGCCTCT AATCGTTCTT CTCTTTTTTC 1080 

TAAATAaAGA AAACCTATCA CTGCTTCTAT CkCTGAACTT TTACGATATG TTTGAACATC 1140 
5 

AGTGTTTTTA GCTTTAGTAT GACTTTTCGC GTTACX3CCCT CGCTTCAAAA TATCCATTTC 1200 
TTCGTCTGTA AACCATTCTT GCTCCATTAA ATATTCTAAC GTTTGCGCCT GACTTTTGGC 1260 
AGATACATAT TTTTT A GACA TTTGATGTAG TTTATTAG6C TTACTTTTAA GCTTTAAAAC 1320 

10 

GATATAGGTA CGTACATATT GATCTAaGAC TGCGTCnCCC ATATATGCTA AGG 1373 

(2) INFORMATION FOR SEQ ID NO: 510: 

■ (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 717 base pairs 

(B) TYPE: nucleic acid 
<C) STRANDEDNESS: double 
(D) TOPOLOGY: linear 

20 

(xi) SEQUENCE DESCRIPTION: SSQ ID NO: 510: 
TCAAGTGCCA ACTACACAAC TGATTTACAT TCTTTAGGTC AATATGTACA AGAAGGCCGT 60 
CGCTTCTTAT TCGAAACAGT TGTAAAAGTA AATCATCCTA AATATGATAT TACTATTGAA 120 
AAAGATAGTG ATGATCTAGA CGGATTAAAT TATTTAGCTG GTAAAACAAT CGACGAAgTT 180 
AACACAAAAG CATTCGAAGG TACATTATTA GCGCATACTG ATGGTGGTGT TCCTAACATG 240 

30. 

GTAGTGAACA TTCCACAATT AGATGAAGAA ACTTTCGGTT ACGTCGTATA CTTCTTCGAA 300 
CTTGCTTGTG CAATGAGTGG ATACCAATTA GGCGTAAATC CATTTAACCA ACCTGGTGTA 360 
GAAGCATATA AACAAAACAT GTTCGCATTA tTAGGTAAAC CTGGTTTTGA AGaCTTGAAA 420 

35 

AAAGrATTAG rAGAACGTTT ATAAAATACA TTACTTCAAA GATTAGTGAA GTTTGAAAAG 480 
ATAGAACTAG ACGTTAACTA TTTAAAGCAT ATTTTCGAGG TTGTCATTAC AAATGTAAAA 540 
40 ATGTAATGAC AACCTCGTTT TTATTTATAT GCAAGAACTA GGTTACTAGC TAaTGTGACA 600 

AGATGTTAAG AGAAAATTAA aGATAAAATA ATATCTGCCT TACAATAATA TTGTTATACT 660 
ACTAGnGACT GATTTATTAG CATGATTACA TGTTAATGTT TCTTTACTTA GTAATTA 717 
(2) INFORMATION FOR SEQ ID NO: 511: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2700 base pairs 

(B) TYPE: nucleic acid 

so (C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 
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AATCTAATTT TTCCTCCTAA TCTCGGATTG GATAGTGGTC AATTTTTCTG GCCCGCCATT 60 

TTAGCGTTTG TTCTAACTGG GATTGGTTTA CCATTATTAG GTGTGATTGT AGGTGCACTT 120 

5 

GATAAAGAAG GATATATTGG CGCATTAAAT AAAATTTCAC CTAAATTTTC AATATTGTTC 180 

TTAATCATCA TTTATTTGAC TATAGGACCA CTTITTGCAA TACCTAGAAC TGCATCTACA 240 

TCTTTTGAAA TGACAATTAC ACCAATTATA CATAGCAATA GTAGTATCGC TTTATTTATA 300 

70 

TTTACGATTA TCTACTTCAT AGTCGTTTTG TATATTTGTT TAAATCCATC TAAGTTAATC 360 

GATCGTATTG GTTCATTATT AACACCATTA TTATTGATTA CTATTTTAGC GATGATTATT 420 

75 AAAGGATACT TAGACTTTAG CGGTAATAGT GCTGGAAAGG GCAATGAAGC ACTATATCAT 480 

TCTAATTTTT CAAGTTTTGC TGAAGGCTTT ACACAAGGCT ATTTAACAAT GGATGCCATT 540 

GCAGCAATTG CTTTTTCAAT GATTGTTGTT AATGCAGTAA AACTAACAGG CATTACTAAA 600 

ACAAATCAAA TATTCAAACA AACTTTGACT GCTGGTTTAA TTGCAGCCGT AGCTTTAATT 660 

TTCATATATA TTTCATTAGG TTATATTGGT AATCATATGC CAGTAAGTGA CATGACGTTA 720 

GATCAATTGA AATCCAAAGA TCGAAACATT GGGACATATT TATTAACGAC AATGGCTTCA 780 

25 

ACAGGATTTG GTTCATTCGG AAAATATTTA TTGGGCATCA TTGTGGCGCT GGCATGTCTA 840 

ACTACAGCAT GCGGGCTTAT TGTTGCAGTT TCTGAATATT TCCATAGAAT CGTACCTAAA 900 

GTATCATACA AAGCATTTGT ATTAGTTTTC ATTTTAATGA GTTTTATTAT TGCTAACCAA 960 

30 

GGTTTAAATG CTGTTATCTC AATGTCAATT CCGGTATTAA GCATTGTATA CCCAGTAGCA 1020 

ATAACTGTTG TATTATTAAT TTTAATTGCC AAATTCATAC CGACAAAACG CATTTCACAA 1080 

CAAATTCCAG TTATTATCGT ATTTATATTG TCGATTTTCA GTGTTATTAG TAAGTTAGGT 1140 

TGGCTGAAAA TTAACTTTAT AGAATCATTG CCTCTAAGAG CGTATTCTTT AGAGTGGJcTC 1200 

CCAGTAGCAA TTATTGCAAC GATATTAGGC TATCTAGTCG GCATATTTGT AAAACAAGAT 1260 

40 CCAATTAAAT ATCAACAGGA ATAACGAATA ATATAAAAGA GGTTGGGACA TAAATCCCTA 1320 

AAAAAACAGC AGTAAGATAA TTTTCAATTA GAAAATATCT TACTGCTGTT CTCTATTTAT 1380 

ACAATACTTC GTATTGAATG GCTTCGCTTT CCTAGGGTGC CGTCTCAGCC TCGGTCTTCG 1440 

ACTGGCACTG CTCCCTCAGG AGTCTCGCCA TTAATACTAC GTATTAACGT GTAATTTTAC 1500 

TTTGAAATAC TTTAAAAAAA TAAGACACTT TGCCCAACTT GCACATAAAT GTAAAATTCA 1560 

ATAAAATAAA TTTTCTGTGT TGGATCCCTT CGTATAATTT AATAAATAC7 ACTAAACTAA 1620 

SO 

ATTAACGAGG TGCCTTATGT ATAAAAATTA TAACATGACC CAACTTACAC TACCAATAGA 1680 

AACTTCTGTT AGAATTCCTC AAAATGATAA TACGCGATAT GTTAATGAAA TTGTTGAAAC 1740 

55 



1438 



EP0 786 519 A2 

AAGATATGCA TACCGTAATG ATAGATATAG TTTTAAACGT GACTTCAAGC TATATGAATG 
TGATGACTGT TCATCATGTT CTTTGAGACA TCAATGCATG AAGCCAAATT CGAAATCCAA 

5 

TAAGAAAATT ATGAAGAATT ATAATTGGGA ATACTTTAAA GyCCAAATTA ATCAAAAGCT 

. .TTC^lXjJ^QO^.GBi^QiA^J^Si^^^ i^c^^T^'^'i^t^ 

TGGATTTATG AAGGCTATTT TGGGTTTCAC TCGAATGTCA GTTCGAGGAA TAAATAAAGT 2100 

TAAACGAGAG CTAGGTTTTG TATTAATGGC ACTTAATATA AGGAAAATAG CAGCTCAACG 2160 

AGCTGTACAT TATAAAATAC ATATCAAAAA AGCTGATTTC TATCAAATAA TTAATAGAAA 2220 

TCAGCTTTTT TACATTGCCT AAGAATTTAA TGTCCCAAGC CCTTTTTATC GAATAACTTA 2280 

TTGTAAACCT TGTCTTTCTT GGTTATTGTT TTCGTTATTT TTTTCGTGTT TTTGTTTCCA 2340 

CTCTTTTTGA GTCATTACAT CGTCAACTTG CATGTTAACT TCAACTACAT CTAAACCAGT 24 00 

AATATATTTA ACTTGTTCTT TAACTAATTC AGTTACTTTA CGGAAGATTT TTGG7GCTGA 2460 

TTCACCATAT TCTAAGATTA CTTTTAAGTC TACAGCAGCT TGTTTTTCAC CAACTTCAAC 2520 

AGATACACCT TGAGTAACAT TGTTGCCACT TGAGAATGCA TTAGTGAATG TATCAGTTAA 2580 

GCCACCTTTC ATATCTAAGA TACCTTTAAC TTCACGTGCA GCGATACCAG CAATTTTTTC 2640 

AACAACTTCA TCAGAGAATG TTAATTTGnT TTTGAATTGA GGCTCCTGAT TTnGTTCnTG 2700 
(2) INFORMATION FOR SEQ ID NO: 512: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1135 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 512: 



ATCAAATACA ATAATTAAAA TAaTGGCTAA 


TACaCCTAaA 


ATaATAATcG 


AGTTaGAGTA 


60 


GCCTAAGCGA yCACCcTAAC aGTArACATT 


CTAGGCATAT 


ATTTaTCTTT 


AGACATTGAA 


120 


GCCGCTAACA TCGGAAAAGC TGTAAATCCA 


GTGTTGGCTG 


CTAATACCAA 


AATCATCACG 


180 


GTCGTTGCCT GTACAAAATA GAAGGCAGCA 


TTATCACCAA 


ATATTTGCAT 


AGCTAATTGT 


240 


GATAAAACTG TCGTTTCCGT TTGTGGcAAA 


ATTCCATAAA 


CATATGCTAA 


ACCAACGATA 


300 


CCAACTAATA AAAACGCTAA AATTGAACCC 


ATAGCAATTA 


ACGTTTTCAC 


AGCATTTTTA 


360 


GCACTTGGCT CTCTAAAATT GGTTACCGCA 


TTTGAAATAG 


CTTCAACACC 


CGTTAACGAT 


420 


GAAGCCCCTG ATGAAAATGC TTTTAATAsC 


AAGAATAATG 


TTACTCCAGG 


AACCGCAGTT 


480 
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10 



AATATTAATA TCACTAACCC TATAATGAAA AGATATACTG GATAGGATAA TACGGTGGCA 600 

C3ATTCAGTTA AACCACGTAA ATTTAATATT AAAATAAAAA GTACAAGTAw ACATGCAATC 660 

AGTrCIcTTAT GCCCATATAA ACTTGGGAAT GCAGCAACAA ATGCATCAGC ACCAGATGAT 720 

ATmCTAACAG CGACAGTCAG TATGTAATCG ACTAATAATG AGCCTCCTGC AAGCAATCCC 780 

CATTTTTCTC CTAAATTGGT CTTGGACACC ATATACGCGC CGCCACCTTT AGGATATGCA 840 

TAAATAATTT GCCTATAAGA CATAATTAAA GCAGCTAATA AGATCAGAAC AGCACCTGCA 900 

ATCGGTAAAG TATACCAAGT TGCAACTGCA CCCACTACTG ATAGTGTAAT CAGTATTTGT 960 

TCGGGACCGT AAGCCACTGA AGATAATGCA TCCGACGAAA GAATCGCTAA CCCTTTAAAC 1020 

TTCGATATCT TTTCGTCTTT TAGTTCTCTG TTTTTTTTAG GTTGCCCTAT AATAAGtCTT 1080 

TTAAATTGAT JcGAcATAAtC TCCTATTCCT TTTTATAGTT TTnGATGGAA ATCAC 1135 
20 (2) INFORMATION FOR SEQ ID NO: 513: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 918 base pairs 
(B> TYPE: nucleic acid 

(C) STRANDEDNESS: double 

^ (D) TOPOLOGY: linear 



IS 
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(xi) SEQUENCE DESCRIPTION: SSQ ID NO: 513: 

TTATGGTAAA ACTTTAACAC AAGCATTACA TA/VATCGCAA TCATTTATGT GGCAAAAACG 60 

TTGAATTTAA GCCATTTCTA TTCATTTTAC GTAATTATTA GCCGTATATG TOTAATAATA 120 

CACATTTTAT TCAGATTTTT TATCGCGCTC CATTAAATCT TTTACGCATT CTTTTACTGA 180 

GATATTTTCA AATAATACTC TATATAATGC ATTTGTAATT GGCATATCCA CATTTTTTTC ' 240 

TTTAGCTAAA TGATAAACTG ATTTAGTTGT ATAAATACCT TCAACAACCA TATTCATTTC 300 

40 AGATAATGCT TGATCCATTG ATTCACCTTG TCCAAGTTTA TATCCTAATG TGAAATTCCG 360 

AGAATGTGTT GATGTGCAAG TAACGATTAA GTCACCGATA CCACCTAAAC CTAGAAATGT 420 

CATAGGATCG GCACCTAACT TTTCACCTAA TCTACTAATT TCCGCTAAGC CACGAGTCAT 480 

TAATGCAGCT TTTGCATTAT CACCGTAGCC AATTCCAGCT ACGATACCAC TTGCTACTGC 540 

GATGATATTT TTCAATGCAC CACCAAGTTC AACACCAATC AAGTCATCAT TCGTGTACAC 600 

ACGCAAATAA TCATTCATAA ATAAATCTTG CGTTAATTTA CTTACACTTT TATCTTTTGA 660 

TGAAGCAGCA ACTGTAGTTG GTTGCTTGAC TACAACTTCT TCCGCATGAC TTGGCCCTGA 720 

CAACACGCCA ATACCTGCAT TATATTCAGG TGAAATAGAA TCTTCAATCA TTTCTGACAC 780 
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CAGCTTATCA TTAATTTGAG AAGCAACTTC TCGCATTGCT TTAGTAGGTA AAGCCATTAA 900 
GTAAATATCT GCAAATTG 918 
^ (2) INFORMATION FOR SEQ ID NO: 514: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 587 base pairs 

(B) TYPE: nucleic acid 

10 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



15 



25 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 514: 
CAATACTCGG TATTATAGAT AGTCCTACTA CATTTATATG GGTTTGTATC ATTACATTAA 60 
TTGCACATCA ACTTGAAGGT AATATCATTA CACCAAATGT AATGGGTAAA TCTTTAAGTA 120 
20 TCCATCCTTT AACAATTATC GTTGTTATTT TAGCAGCAGG AGATTTAGGT GGCTTTACAT 180 

TAGTTCTGAT TGCAGTGCCA TTATATGCTG TACTTAAAAC GGTTGTTAGT AATATTTTCA 240 
AATACCGCCA ACGCATTATT GATAAAGCAA ACAGTAATGT TAAGGACTAA TTCTGTGGAT 300 
GTCTTTTAAG AATATAAGAT ACTATCGCAT CAAAAGTTGA AACTACAGCT TTTGAGGCGA 360 
TTTTTTTGTG CATAAAAAAT CAGTCmAATG AAATATCAAA TAATTTTCCA TCAGTCCGAT 420 
TATTATAAAA GCAAAAAAGC TTTGCTCACA TATATAATAA CGTGAACAAA GCTGTTGAAT 4 80 

GATATTATTT AATTGCGTGG AATCCGCTAT CTACATGAAT ATTTTCACCT GTAACGCCAC 540 
TTGATAAATC ACTTAATAAG TAAGCCGCAG TTTTACCTAC TTCTACT 587 
(2) INFORMATION FOR SEQ ID NO: 515: 

35 

it] SEQUENCE CHARACTERISTICS; 

(A) LENGTH: 812 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 
40 (D) TOPOLOGY: linear 



30 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 515: 

GGTTCATTCC AAAAAAGTAC GCGATAATTA GCGAAGAAGA ATTTGAAAAT TTAAATGTTG 60 

TTAAACCAAA TAAAAATAAT GTTTTCTGGT CAGTTATAGG AAGTTCGGTT TTGTTTGGAG 120 

TTACTTTAAG GAAATACATA CATGTTTTTG ATGTTCAATT AGATAAGCTA GTTGTAATGA 180 

TATTGTGTGC TCTCGCTTTA ATTTGTGTTA TAGTTTTTTA TTTTAACTTA AATAGAAAGC 240 

TTAAGTTAAA AGTGTTTGAT ACAAATATTG AAAAAnATAA GAGAGTTATA TAAAwAcCAA 300 
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TTTCATTAAT TGCCCTTATG ACAATCGAAC CTCAAAATAT AATAATATTT ATTTATTGGA 
TTATGATGAC AATGCTTTTC TTTTTGTTAA ATATGACTTC GATAGGTAAT GAAAAAGTTC 
GCGTTATAAT GAAAAATAAT TGATTACATT TAAAATATTC TAAATGTTGT CGACACAATC 
CTTTTAAGAC GCTAGTAGAA TTTAAATGAC TTCTAATGTA TATGAAAGTG TATCAATATA 
AAACCAATTG AAAAGAAGTG GAGACATTGC TTTGTGAAAC TGAAAATATT AATAAGAATC 
CCAAATATAG AATTATCAAA TACAAAGATG AATATTTGAT GATTGATTTA GTAAGTACAT 
GGTTAGCACT CTTTTTCCCA ATGATTAATT GGCTGATTCC AAAAAAGTAC GTCAAAATCA 
GCGAAAAAGA TTTTGAAACT TTAAACATTG TG 
(2) INFORMATION FOR SEQ ID NO: 516: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 526 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDN2SS : double 
(D; TOPOLOGY: linear 

. (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 516: 
GTTCTATTAT TTCTTCCAAT GGTAATGGAT TTTCGTAAAA TGATTGATAT AAGTTGATAA 
TCTCAATAAC TTTTAATTGA TCTGGAAACA TCGTTTTTTG GAACATTATA CTGCGATTTT 
CACTTTGTAA TAACTTGTCT TTATCAAATA TCTCACCAGA ATTAGCATTA ACATTACCAA 
TTAATATATC AATTAACGTT GACTTTCCAG CACCATTTTT TCCAATTAAA GCGATACATT 
TACCTTGTTC AATATCGAAC GAAATATTTT TTAGAACACA TCTTTTATTA AATGACTTGT 
TGATATTAGA TATTTGAATC AATTTAATCA CCTCTATTTT TTTCTTAATT TAATATTAGT 
AAATTTATTA GATTTAAAAT AGAACACTTT GTCATAGATT TGAAATGACA AATGTCATTA 
TTAGATkTAC ATAATATATT TATCGTtATT TTAATTTTGG GCAAAATAAA AAGAGCCTCT 
ATAATCGrGC TCCTTACAAA TAaATTATAA AACtGGCGAA CTAAAT 
(2) INFORMATION FOR SEQ ID NO: 517: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4544 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 517: 
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GGAACACCTA AAGAAAGAAA TGATGCATTA 
AAAGAAAATA CTAAATGGTT ATGCGATCAA 

5 

GTAATTGATG AACTGTCTAC ATTTAAAAGT 
AAGAAATTAC CACTCATTAA TAGATTTATA 
TTACAGGATT TATGGGCTCA AGTTTATTTG 

10 

TTCAGTCGTT ATCGAGAAAG GTACTTTAAA 
AACTGGGAGC TAAGAGACGG ATCTGAAGAA 
TTAAGCATGA AAGCGAAAGA TTATCTAGAT 
GTAGTCTTAT CTGAAAAAGA A2VGAAAAGTA 
GAATCGGAAG AAGAAGGAAC AGTTGTAGCT 
20 CTTCAACTAT CTAACGGTGC AGTTTATACA 

AAGAAGTTAG ATAAGTTAGA GGAAATTATA 
TTTTATAACT TCaAACATGA TAAAGAAAGA 
TTaGAGGATT CAAACTATAA AGAACGTTGG 
CATCCAGCAA GTGCAGGGCA TGGATTAAAC 
TTTGGACTTA CATGGTCATT GGAATTATAC 

30 

GGACAAAATC ATACGACTAT TATTCATCAC 
GTATATAAAG CTTTACAftAA TAAAGAACTA 
GCAAGAATAG CTAAGCATAA GTAATGGAGG 

35 

AAGCCAGGTA CATTTAAATA TATTGAGTCA 
GAGATAAATA GATTGAGAAT GGAGATACTT 
40 GTGTATGGAC CGTTGCAAAA AGGTGAACCA 

TTATTGACTA ATAAGATGTT ACGAAACCTA 
TACTTAAAGT TACCTGAAGA TCATAAGAAA 
AAGAAGCTAA AGATAGAGCA AATAGGAGAT 
ACTATACGAA AGAACTTTGT TAAAGCGGTA 
GCAAAGATTG TGCAAAAGGC CTACAAATCT 

50 

TAAAGTTATC TAAAAGTTAT ACGACACAAG 
TTTGTTATGC AATCAAAGAG GTGTAAGAGA 

55 



AACACAGAGG CTGATATCTA TGTAACCAAT 120 

TATAAAAAAG AATGGCCATT TGATATGGTT 180 

CCTAAGAGTC AAAGGTTTAA ATCTATTAAA 240 

GGATTAACAG GAACACCTAG CCCAAATAGT 300 

ATAGACAGAG GCGAAAGACT TGAGTCTTCA 360 

CCAACACATC AAGTTAGCGA ACATGTTTTT 420 

AAGATATATG AACGAATAGA AGATATATGT 4 80 

ATGCCTGACA GAGTTGATAC TAAAGAAAGA 540 

TATGCAGAAT TAGAAAAAAA CTATATTTTA 600 

CAGAATGGGG CATCATTAAG TCAAAAACTA 660 

GATGATGAAG ATGTAAGACT TATACATGAT 720 

GAGGAGTCTC AAGGCCAACC AATATTATTG 780 

ATACTTCaAA GGTTTAAGGa AGCAACCACA 840 

AATAGTGGAG ACATTAAGCT GCXTATAGGA 900 

TTACAACAAG GTGGGCACAT TATTGTTTGG 960 

CAACAAGCAA ATGCAAGATT ATATAGACAA 1020 

ATTATGACCG ATAACACAAT AGATCAAAGA 1080 

ACGCAAGAAG AATTGATGAA AGCTATTAAA 1140 

TATAAGATGG GAAAGGCATC ATACGATATT 1200 

GAGATATATA ACCTACAAGA GAACAAGAAA 1260 
AACCCAACGA AAGAGCTAGA CACTAACATT . 1320 

GTTAGAACAA CTGAACTAAT GGCAACAAGG 1380 

GAAGAAATGG TCGAAGCAGT TGAAAGTGAA 1440 

GTAATTAGGC TAAAGTATTG GAATAGAGAT 1500 

GCATGTCACA TGCATCGTAA TACAGTTACT 1560 

cGwtATCATG CAGGTATCAA ATAACATTGT 1620 

GTAGTAATAT GATAGTATCG GAAAGATGTA 1680 

TACACGAGGC ACATCGCTAT GCGtGTGTCT 1740 

TGACCAAGCA TAATAACATT TATAAGCATG 1300 
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AGATAGCATT AGATAGGGAT AATCATCTTT GTCAAATGTG TTTACGTGAA GACATAGTAA 1920 

CAGATGCAAA CATAGTGCAT CATATTATTT ATGTTGATGA AGATTTTAAT AAAGCTTTAG 1980 

ACTTAGATAA TTTGATGTCA GTTTGTTATA GCTGTCATAA CAAAATTCAT GCAAATGATA 2040 

ATGACAAAAG TAATCTTAAG AAAATTAGAG TATTAAAAAT TTAAATAAAA AAATAATTTA 2100 

TTTTTATAGC CCCCTACCCA TCGGCTTAAA ATGTTTTTTC GACGGGTACC GGCGGGGGCC 2 ISO 

CTTCGCTTGC AACX3CGGATA AACTTTTATG AAAGGGGGTC TTTATATGAA ATTAACAAAA 2220 

AAACAGCTGA AAGAATATAT AGAGGATTAT AAAAAATCTG ATGACATATT AATTAATTTG 2280 

TATATAGAAA CGTATGAATT TTATTGTCGG TTAAGAGATG AACTTAAAAA TAGTGATTTG 2340 

ATGATAGAGC ATACAAACAA GGCTGGTGCG AGCAATATTG TTAAGAATCC ATTAAGCATA 2400 

GAACTGACAA AAACAGTTCA AACACTAAAT AACTTACTCA AGTCTATGGG TTTAACTGCA 2460 

20 GCACAAAGAA AAaAGATAGT TCAAGAAGAA GGTGGATTCG GTGACTATTA AAGTTTTAAA 2520 

TGAACCTTCA CCAAAACTAT TAACAACATG GTATGCAGAG CAAGTCACTC AAGGGAAAAT 2530 

AAAAACAAGC AAATATGTTA AAAAAGAATG TGAGAGACAC CTTAGATATC TAGAAAATGG 264 0 

25 AGGTAAATGG GTATTTGATG AAGAATTAGC GCACCGTCCT ATTCGATTCA TAGAAAAGTT 2700 

TTGTAAACCT TCCAAAGGAT CTAAACGTCA ACTTGTATTA CAACCATGGC AACATTTTAT 2760 

TATTGGCAGT TTGTTTGGTT GGGTTCATAA AGAAACAAAA CTGCGCAGGT TTAmAGAAGC 2820 

TTTGATATTT ATGGGGCGAA AAAATGGTAA AACAACTACT ATATCTGGTG TTGCTAACTA 2880 

TGCTGTTTCT CAAGATGGAG AAAACGGCGC TGAAATCCAT CTTTTAGCAA ACGTAATGAA 2940 

ACAAGCTAGG ATTCTATTTG ATGAATCTAA GGCGATGATT AAAGCTAGCC CAAAGCTTAG 3000 

AGAAAATTTT AGACCTTTGA GAGATGAAAT TCATTACGAT GCAACTATAT CTAAAATTAT 3060 

GCCACAGGCT TCAGACAGTG ATAAGTTGGA TGGTTTAAAT ACACATATGG GCATTTTTGA 3120 

TGAAATTCAT GAATTTAAAG ATTATAAATT GATTTCAGTT ATAAAAAACT CAAGAGCGGC 3180 

AAGGTTACAA CCCCTTCTTA TCTACATTAC GACAGCAGGG TACCAACTAG ATGGACCACT 3240 

TGTTAATATG GTAGAAGCGG GAAGAGACAC CTTAGATCGA ATCATCGAAG ATGAAAGAAC 3300 

45 TTTTTACTAT TTAGCTTCTC TCGATGATGA CGATGATATA AATGATTCGT CGAATTGGAT 3360 

TAAAGCAAAT CCTAACCTAG GTGTTTCTAT CGATTTAGCT GAAATGAAAG AAGAGTGGGA 3420 

AAAGGCTAAG AGAACACCAG ATGAACGTGG AGATTTTATA ACCAAAAGGT TTAACATCTT 3480 

TGCTAATAAT GATGAGATGA GTTTTATTGA TTATCCAACA CTTCAAAAAA ATAATGACAT 3540 

TATTTCCTTA GATGAGTTGG AAGGTAGACC ATGTACTATA GGTTATGATT TATCAGAAAC 3600 

■ 
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AACACATTCT TGGATTCCTA AGCATAAAGT TGAATATTCT AACGAAAAGA TACCCTATAT 3720 

AGAATGGGAA GAAGACGGAT TACTAACAAT ACAAGATAAT CCTTATATAG ACTACCAAGA 3780 

TGTTTTAAAT TGGATAATAA AGATGAATGA GCATTATGTT GTCGAAAAAA TCACTTATGA 3840 

TAGGGCGAAT GCTTTTAAAT TAAATCAAGA GTTAAAGAAT TATGGCTTTG AAACAGAAGA 3900 

AACWAGACAA GGGGCTTTGA CCTTGAGCCC TGCaTTGAAG GATCTAAAAG AAATGTTTTT 3960 

AGATGGGAAA ATAATATTTA ATAATAATCC TTTAATGAAA TGGTATATCA ATAATGTTCA 4020 

GCTGAAACTA GACAGAAATG GGAACTGGCT GCCATCTAAA CAAAGCAGAT ATCGTAAAAT 4080 

AGATGGTTTT GCAGCATTTT TAAACACATA TACAGATATT ATGAATAAAG TTGTTTCTGA 4140 

CAAGGGTGAA GGAAACATAG inATTTATTAG TATTArAGAT ATAATGCGTT AAGGAGGTGA 4200 

ATGTTATCGC AAAAGAGAAT ATTGTCACAC GCATAAAGAA AAAATTGATA GACAATTGGA 4260 

20 TTGaTCAGTC AGCTTCTAAG CTTTATGACT TTAGCCCATG GAAAAATAAA TCTTTTTGGG 4320 

GTGTAATCAA TAATACGCTT GAAACTAATG AAACGATATT TTCAGCTATT ACnAAGTTAT 4380 

CTAATTCGAT GGCTAGTTTG CCCTTGAAAA TGTATGAAGA TTATAAAGTA GTTAATACAG 4440 

AAGTATCTGA TTnACTTACA GTGTCACCGA ATAATTCTCT GAGCAGTTTT GATTTTATTA 4500 

ATCAAATTGA AACAATCAGA AATGAAAAAG GTAATGCATA TGTG 4544 
(2) INFORMATION FOR SEQ ID NO: 518: 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 881 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 518: 

40 CATGGCAGAA TATTGAAGCT GTAAAAAAAG GACATGTAAT TTCATATAAA GCAGAAGATT 60 

ATTGGTTCAC AGATCCTATT ACATTAGAAC ATTTGAGAAG TAAATTAAAA AAAGAAATTT 120 

TAAATAAAAA ATAATAGAAA TAAGTTGTAA AAATTTTCTT ATGCATTGGT ACTAATGTTT 180 

TTAAGGAGTG ATTAAATGAA GCAACTGGTT GGAATTCCCG AATCAATGTT AATTCCTTTG 240 

ATAGCTCGAG CAAAAGAGTA CGAAAACGAA AAACCAATAA TAAAAGACGC ACTATCAAAA 300 

AAAATATTTG ATGGTTTAGA TGATATGTAC AAAAATGTTA CATGTGATGA CATGTCTCAA 360 

ATTGGAATTA GTATACGTAC TGTGATAATA GATTGTGTTA CTAAGAGGCT TATCAAGGAT 420 

AATAAAGATT TAATCGTGGT CAATATAGGT TGTGGCTTAG ATACAAGGTT TCAAAGATTT 480 
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ACATTTTTTA AAGAAAGTAA TAGTTATAAG ATGATATCTA AATCTATGCT AGATTACAGT 600 
TGGATTGATG ATGTCAAAAA TTATAAATTT TTTAATAGTA AGTCAGATAT ATTGTTTATT 660 

5 

ATTGAAGGTG TATTGaTGTA TTTTGATGAG AGTGTAATGA CTCAATTATT GGACACTATT 720 
ATCAAAAAGA TGGGAGATCA TAATTTGACA TTTGCGATTg AATTTTGCTC aAAAACAATT 780 
GCGAATAATA CmAAGAGACA TCAATOGGTA TCCAAGTTAT CCTCACCACC TGTTTTTAAA 840 

10 

TATGGGTACC ATGATTTAnA AAAATTGGAT GAnATTTACC C 381 
(2) INFORMATION FOR SEQ ID NO: 519: 

U) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3122 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

20 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 519: 
TGAATaaAAA TATATTAATA GATAAACACA AATGTGTCcA AATACCCCTA GAGGTATTTG 60 
ACnAGTTCCA TCCAACTGTT TAAAATACCC CTACAGGTAT TTTTAGGGAG GTTATTATGA 120 
AACAATACGG AGAAAaGTTT ATCGATGAAT TTAGTAAAGC AGAATTGGAA AAACTAGCCA 180 
AGCAAGGGCA ATTAATTGAC GTTAGAACAG AAGAGGAGTA TGCATTAGGA CATATCAATG 240 

30 

GTTCCATACT TCATCCTGTT GATGAGATTG AGTCATTCAA TAAAGAAAAA AATAAAACCT 300 
ATTATGTAAT CTGTAGAAGT GGTAACAGAA GTGCTAATGC TAGTAAATAT TTAGCTAAAC 360 
AAGGTTATAA CGTTATAAAT CTTGATGGTG GTTATAAAGC TTATGAAGAA GAAAACGATA 420 

35 

GTTATGATAC ACAAGAAGAA TATAAAAGTA TAGAAATTAA AGCAGATCGT AAACAATTTA 480 
ACTATCGTGG TCTTCAATGT CCAGGGCCAA TTGTAAAAAT TAGTCAAGAA ATGAAGAATA 540 
40 TTGAAGTAGG TGACCAAATT GAAGTCAAAG TCACAGACCC TGGATTCCCT AGTGACATTA 600 

AAAGTTGGGT GAAACAAACA AGGCATACTT TAGTTAAGCT TGATGAAAAT AACAATGGAA 660 
TTAATGCGAT TATTCAAAAA GAAAAAGCAA AAGATTTAGA TATAAATTAT TCTGCTAAAG 720 
GTACTACAAT TGTATTATTT AGTGGAGAAT TAGACAAAGC TGTAGCAGCG TTGATTATTG 780 
CAAATGGTGC TAGAGCTGCT GGAAAAGATG TAACTATCTT CTTTACTTTT TGGGGGCTTA 840 
ATGCATTAAA AAAAGTGCAA ACAGTTAATG TTAAAAAGCA AGGTATTGCA AAAATGTTTG 900 

$0 

ATTTAATGTT GCCCAAAAAG AATATACGAA TGCCTCTTTC CAAAATGAAT ATGTTTGGTT 960 
TAGGAAATAT GATGATGCGC TACGTAATGA AAAAGAAAAA TGTTGATTCA TTACCAACAC 1020 
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25 



TCATGGGTAT TCAGAAAGAA GAACTTAGAG ATGAAGTTGA GTACGGTGGT GTAGGCACTT 1140 

ATATTGGTGC TACTGAAAAT GCGAATCATA ATTTATTTAT CTAATTAAAT CTATTAATAA 1200 

AAGGAGTTGT TATCATGTTT TTTAAACAGT TTTACGATAA TCATTTATCT CAAGCATCAT 1260 

ATTTAGTGGG TTGTCAACGT ACAGGAGAGG CAATAATAAT AGACCCTGTT CGTGATTTAT 1320 

CGAAATATAT AGAAGTTGCA GATTCTGAAG GTTTAACAAT TACACAAGCT ACAGAAACAC 1380 

ATATTCATGC TGATTTTGCT TCAGGAATTC GTGATGTGGC TAAACGCTTA AATGCAAATA 1440 

TATATGTGTC TGGCGAAGGT GAAGATGCAT TAGGGTATAA AAATATGCCA TCAAAAACAC 1500 

75 AATTTGTTAA ACATGGAGAT ATCATTCAAG TAGGCAATGT TAAATTAGAA GTTCTGCATA 1560 

CTCCAGGACA CACGCCTGAA AGTATTAGCT TTTTACTCAC TGATTTAGGT GGTGGTTCAA 1620 

GTGTTCCGAT GGGATTATTT AGTGGTGACT TTATTTTTGT TGGTGATATA GGTAGACCTG 1680 

20 ATTTAtTAGA AAAATCTGTT CaAATAAAgG GTTCTACAGA AATTAGCGCG AAACAAATGT 1740 

ATGAGTCCGT TCAAAATATT AAAAATTTAC CAGACTATGT TCAAATCTGG CCGGGTCATG IBOO 

GTGCTGGAAG CCCTTGTGGT A^AGCATTAG GTGCCATACC TATATCTACA ATAGGTTATG 1860 

AGAAAATTAA TAACTGGGCA TTTAATGAAA TTGATGAGAC TAAATTTATT GAATCATTAA 1920 

CATCAAATCA ACCAGCACCA CCGCATCATT TTGCACAAAT GAAACAAGTT AATCAGTTTG 1980 

GTATGAATTT ATATCAATCA TATGATGTTT ATCCTAGTTT AGATAATAAG AGAGTAGCAT 2040 

TTGATCTTCG TAGCAAAGAG GCCTTTCACG GTGGCCACAC AAAAGGAACA ATCAATATAC 2100 

CATACAACAA AAACTTTATT AATCAAATTG GTTGGTACTT AGATTTTGAA AAAGATATAG 2160 

ATGTAA7TGG AGATAAATCT ACTGTTGAGA AAGCGAAACA CACTTTACAA TTAATTGGGT 2220 

TTGATAAGGT AGCAGGCTAT CGTTTGCCAA AATCAGGCAT TTCAACCCAG TCCGTTCATA 2280 

GCGCTGATAT GACAGGTAAA GAAGAACATG TATTAGACGT ACGTAATGAT GAAGAGTGGA 2340 

40 ATAATGGACA CTTAGATCAA GCAGTTAATA TTCCGCATGG TAAATTATTA AATGAAAATA 2400 

rrCCTTTTAA TAAAGAGGAT AAAATATATG TACATTGTCA GTCAGGTGTT AGAAGTTCAA 2460 

TTGCAGTGGG TATATTGGAA AGCAAAGGTT TTGAAAATGT GGTGAATATT AGAGAAGGCT 2520 

ATCAAGATTT TCCAGAATCA TTAAAATAAT TTAAGGATGT GGAAAAAATG AATAAGCATT 2580 

ATCAAATTGT TATTATTGGT GGCGGTACAG CAGGTGTTAC CGTAGCATCA AGACTATTAA 2640 

GAAAAAATCA AAACTTAAAA GAGAAAATAG CAATTATAGA TCCAGCAGAC CATCATTACT 2700 

ATCAACCATT ATGGACGTTG GTTGGTGCAG GGGTATCTAG TTTGAAAAGT TCTCGTAAAG 2760 

ATATGGAAAG TGTTATACCT GAAGGTGCTA ACTGGATAAA ACAGGCTGTT TCAAGTTTTC 2820 
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TAGTAGCTCC AGGATTACAG ATTAATTGGT CTTCAATTAA AGGACTAAAA GAAAATATAG 



2940 



GTAAAAATGG TGTTTGCTCT AACTATTCAC CTGACTATGT TAACgAAACT TGGAACCAAA 



3000 



TTTCTAATTT TAAACAAGGA AATGCCATTT TTACGCATCC AAACACTCCT ATAAAGTGTG 



3060 



GAGGTGCgCC TATGAAAATT ATGTATTTAG CTGAAGATTA TTTTAGGAAA CATAAAATCC 



3120 



GT 



3122 



10 



15 



20 



25 
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(2) INFORMATION FOR SEQ ID NO: 520; 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3982 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 520: 

ATAnAGATAT AnATnAATAT ATTGAGGTCA AACGATGATA ATTAAAATTT TAACAATTCT 60 

ATTACTACTT TGTATATTGA GCTATTTGGT TACAAATAGA AAGAAGCCTT TTCTGTTCTT 120 

AAAGACACTC TTTATGGGTG TGGTATTTAT CTTTATAGGA TATATTTCAC TGGCAATATC ISO 

TGCCGTAATT ATTTATGGTA TTATTCAATT TATCACAATT GATTTTGGTA GTTTTTTCTT 240 

AATGGGTATT ATATTGATCT TGATTTCAAG TATATTCCAA TTATTTATAG TTAGATTACT 300 

TTTTAjGAAAA AAGAATGTCG ATTTGACAGA GGTTGTCGTT TTAsAsCATT TAATTCAATG 360 

GTTCTTAGTT TACTTTGCGA TCTATCAAGC AGTAAATGAA AAAATGGACA TTAATGATAT 420 

TAATATCGAC AATTTCCAAT CTGTCTTTTT TGACGTGTCT AATTTGAATT TAGTAATTCT 480 

ACCAACGTTA ATCATTAGCT GGGTCACAAT ATTTAACTAT AGAATGAGAA GTTACAAATA 540 

AAATCTATGA GATTATACCT TCAGACACCA ACATTCAAAT GGTGTCTTTT TTGTTGTGTG 600 

GTTrrATTTT TGAAATTCGA AAAAGTAGAG GCATGAATTT TTTGACTAGT GTATAAGTGC 660 

TGATGAGTCA CAAGATAGAT AGCTATATTT TGTCTATATT ATAAAGTGTT TATAGTTAAT 720 

TAATAATTAG TTAATTTCAA AAGTTGTATA AATAGGATAA CTTAATAAAT GTAAGATAAT 780 

AATTTGGAGG ATAATTAACA TGAAAAATAA ATTGATAGCA AAATCTTTAT TAACATXAGC 840 

GGCAATAGGT ATTACTACAA CTACAATTGC GTCAACAGCA GATGCGAGCG AAGGATACGG 900 

TCCAAGAGAA AAGAAACCAG TGAGTATTAA TCACAATATC GTAGAGTACA ATGATGGTAC 960 

TTTTAAATAT CAATCTAGAC CAAAATTTAA CTCAACACCT AAATATATTA AATTCAAACA 1020 

TGACTATAAT ATTTTAGAAT TTAACGATGG TACATTCGAA TATGGTGCAC GTCCACAATT 1080 
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TCAAAATCTT GTGAGAGAAT TTGAAAAAAC ACATACTGTC AGTGCACACA GAAAAGCACA 1200 

AAAGGCAGTC AACTTAGTTT CGTTTGAATA CAAAGTGAAG AAAATGGTCT TACAAGAGCG 1260 

AATTGATAAT GTATTAAAAC AAGGATTAGT TAAATAAAAC TTCAATCGTT GCTGTTATCT 1320 

GGAAATAATT AATTAAATGT TATGTTAATT TTTGTTAATG AAAAAAGTAA TCTATTTAAT 1380 

GACAGGTTAA TGTAATTGTC CTGAAATTGA CTATATACTC AGTAAGTATC AATTTTAAGG 1440 

AGAGCTTATA ATGAAATTTA AAAAATATAT ATTAACAGGa ACATTAGCAT TACTTTTATC 1500 

ATCAACTGGG ATAGCAACTA TAGAAGGGAA TAAAGCAGAT GCAAGTAGTC TGGACAAATA 1560 

TTTAACTGAa aGTCAGTTTC ATGATAAACG CATAGCAGAA GAATTAAGAA CTTTACTTAA 1620 

CAAATCGAAT GTATATGCAT TAGCTGCAGG AAGCTTAAAT CCATATTATA AACGTACGAT 1680 

TATGATGAAT GAATATAGAG CTAAAGCGGC ACTTAAGAAA AATGATTTCG TATCAATGGC 1740 

TGATGCTAAA GTTGCATTAG AAAAAATATA CAAAGAAATT GATGAAATTA TAAATAGATA 1800 

ATAAATAAAA CAGGTTGAGA CAAAAAATGG TCTTAACCTG TTTTCAATTT GCATATGTGA 1860 

TAAATTCTAT ATCAAAATGC TTATGTATAA TGAATGACAT TTAAAAGTAG GGGAGACAAA 1920 

25 TATAAATACA ATAGTTCCTA GGATTACTCT CAAAATAACT ATATCAATTA TTTACTTTGC 1980 

TCTCCTATTT TTTAAAATAT GTACATGTTT AAACAATCAA AAGTGTACAA TATTAAATTA 2040 

TCATTTCCAG TTCTAGTGCT ATATTGGTAG TAGTTGACTA AATGAAAATA AGCTTATAAC 2100 

30 AAGl'TrTi'TC AATACTCGTG GGGCCACAAC AGAGAGAAAT AGGATCACCA ATTCCAACAG 2160 

ACAATGCAAG TTGGCGGGGC CCCAACATAG AGAAATTGGA TCACCAATTT CAACAGACAA 2220 

TGCAAGTTGG GGTGGGGCCC AACACAGAAG CTGGCGAAAA GTCAGCATAC AAAAATGTGC 2280 

AAGTTGGCGG GGCCACAACA GAGAGAAATA GGATCACCAA TTCCAACAAA CAATGCAAGT 2340 

TGGCGGGGGC CCCAACATAG AAGCTGGCGA AAAGTCAGCT TACAAAAATG TGCAAGTTGG 2400 

CGGGGCCCCA ACATAGAGAA ATTGGAACCC CAATTTCTAC AGACAATGCA AGTTGGGGTA 2460 

GQACATCGAT AAAGAAATAC TTTTTCTTTA GCAATTAGTA TTTCTTATGC ATGAGCTTTA 2520 

CTCATGTATT CATTTTTTAA GTACaCATTA GCTACAGCTA ATGATAAAGA ACCACTACAT 2580 

4S AATAAATCAT TAGTGGTTCT TTATCATTTC TATCTCACTC TTTTACTGGA AGAAAAAGTT 2640 

TACGTTTGTA GAACATGCCA CAATACCAAA AATAATTAAG AAAAATAAGA CGATAAGCAT 2700 

GATGACACTT TTCAAACAAC CTCTATCAGT TTCTTTCGAT TTTCTTTGTT GAACCTTTTT 2760 

ATAATCTTCA AGTAGTTTTG CGGCTTTTTT ATTTATATGT TTATTCATGA TGTTGACTCC 2320 

TTATAATATA TGTTTAATTC ATTAAAATAG TTGAAAACAT GACTTGAAAT AAAGATATAA 2880 
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AATTTGATGA TGATATTTGC TTTTTATTTT CCAAATGGAA TTTACTTAAA CTGATGCATT 3000 

AAAATATTAA TGAAGCACTA GAATACATAA ATGAATAGTa ATGGTGcACA GTATAGAATA 3060 

5 ATTAAGGCTA TATTAAGTAT AAATATCGTT AACTGTAAGC TATCTTTAGT TTTAATATAA 3120 

ACTATTAGGA TAATCGACGT AAGAAGAATC ATATATATTA ATGATGAAGA AGTCCATACA 3180 

AAATCCGCAT CATTTGTTG? TAATAATGGG ACTATAATTA ATCCGAAATT AATCATGCAT 3240 

GCTATATATA CTATAATGTT ATACACAATG TTAATTTTTG TTCACCACCT TATACTTCTA 33 00 

TTTTAAAAAC TTCTTTATAA TGATATATTG TTTAATGTTG AAATAATTAG ATTATCTAAT 33 60 

TTTCATTTGC TTTACATGTA AAAGGCTATA TATAGTATGC TCTTTATGAT TCTAAATGCT 3420 

15 

TTTTAATATT TAATGCTCAT CAACATTTGG ATTTTGAATA TTCAATTCAA AAACTTTATT 3480 

AGCTACGTCA ATTGTAAAAT CAGAACCATA GTTGACATGA GCTACTTTTA ATTTTCCATC 3540 

TAAATAATAG ATTGCGATTG CAACATCGTA AAATTCGTCA ATGACAAATA AACTCTTTTC 3600 

20 

GTTTGTTACA ACCTCATGCT CTCCTGAGTA TACAACGTTA ATTTCCCAAT CATTAAAAAC 3660 

CATTTGTTAA CCTCCTTGAA CATTTAAATT GATTCAACTT AAGTTTAACT TATTCATACA 3720 

25 ACTTCGTACA ATATCTAGAT GAACATTAAT TGTATTTCTA GAAATCTTTT TCAATTATAT 3780 

GTACTAATTA TACTTTTAAA TTTCTTATTT CAGTATAGTT TTAAAACGAT TTTAAAATAA 3840 

TTCTGCAAAT ATATTAACAC ATAATGTGTT CAAAAAGTTT TGAACAATTT CAAAACTTTT 3900 

30 ATATAAAGGG tlTTGACAACA TGGATTCAAA TnTCTTATTT TAAAAATTAC CTCATATAGT 3960 

GTCATGTTAG CCAATTTTTA AG 3982 
C2) INFORMATION FOR SEQ ID NO: 521: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1353 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

40 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 521: 
AGCTTGGaTG ATTTAATaTG GtCCtTTCCC AaCcTTAGAT AATGAAAGAT tTGATAATCC 60 

45 

TGAATATAAA GAAGCTATGA AAAAATATcA ACAGAGATTT ATGGCTGmAG ATGAGGCTTT 120 
GAAGAAATTT TTTAGTGAAG AGAAAAAAAT aAAAAATGGA AATACTGATA ATTTAGATTA 180 
SQ TCTAGGATTA TCTCATGAAA GATATGAAAG TGTATTTAAT ACTTTGAAAA AACAAAGTGA 240 

GGAGTTCTTA AAAGAAATTG AAGATATAAA AAAAGATAAC CCTGAATTGA AAGACTTTAA 300 

55 
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GTTAGGTAAA ACATTTTATC AAAACTATAG 
AGATTTAATT ATGGGATATA AAGATGAAGA 
GATGTTAGAA AATAAAAAAG AAGACTTAGA 
AGATAAAACA AGACCTAATA ATATTCCTGT 
TCATAAAAAT ATGGCTCAAT TAAAATCTGA 
AAGAAGCAAG AGAAGTAAAA GAAGTTTAAA 
AGTTTCTGAA CAACAAAAAG CTGAATATGA 
TTTGGATAAT CAAAAAATTA AGAAAACACC 
TAAACAACGT ATTGACAACG AAAACGACAA 
ACCAACATCA CCGACTACAT ATACTGAAAC 
GCGTCAAACT CAGCAACAAA TTATTTATAA 
TGAAAGTCAT GATTTCACAA CAACGCATCA 
TAATGTTGTT GAATTTGAAG AAACGTCTGC 
TGGTATAAGT CAAATTGATT CTTCTCATCT 
TGAACACGTT AGAGAAGCTC AAAAGTTAGT 
AGACCGAATA AATGCACAAC AAAAAGTAAA 
TAATAAACAA ATCAATAAAG TATATAATGG 



AGATGATGTT GAAAGTTTAT ATAGTAAGTT 
AAGAGCAAAT AAAAAAGCAG TTAACAAAAG 
AACCATAATT GATGAATTTT TTAGTGATAT 
TTTAGAAGAT GAAAAACAAG AAGAGAAAAA 
CACTGAAGCA GCAAAAAGTG ATGAATCAAA 
TACTCAAAAT CACAAACCTG CATCTCAAGA 
TAAAAGAGCA GAAGAAAGAA AAGCGAGATT 
TGTAGTGTCA TTAGAATATG ATTTTGAGCA 
GAAACTTGTG GTTTCTGCAC CAACAAAGAA 
AACGACACAG GTACCAATGC CTACAGTTGA 
TGCACCAAAA CAATTGGCTG GATTAAATGG 
ATCACCAACA ACTTCAAATC ACACGCATAA 
TTTACCTGGT AGAAAATCAG GATCACTGGT 
AACTGAACGT GAGAAGCGTG TAATTAAGCG 
TGATAATTAT AAAGATACAC ATAGTTATAA 
TACTTTAAGT GAAGGTCATC AAAAACGTTT 
GCA 



(2) INFORMATION FOR SEQ ID NO: 522: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1987 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 522: 
GTCTGAGTCA GGTGCTGTTT GGTTAGATGC TGAAAAAACA AGTCCTTATG AATTTTATCA 
ATTCTGGATT AATCAATCAG ACGAAGATGT AATTAAATTC TTnAAATACT TTACTTTCTT 
AGGAAAAGAA GAAATTGATC GCTTAGAACA ATCTAAAAAT GAAGCACCGC ATTTACGTGA 
AGCTCAAAAA ACATTAGCTG AAGAAGTAAC TAAATTTATT CATGGTGAAG ATGCATTAAA 
TGATGCAATC CGTATTTCAC AAGCATTATT TAGTGGTGAT TTAAAATCAT TATCAGCGAA 
AGAATTAAAA GATGGATTTA AAGATGTGCC TCAAGTGACA TTATCAAATG ACACAACAAA 
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TGTTAACAAT GGTGCGATTT ATATTAATGG TGAGAGACAA CAAGATGTTA ATTATGCTTT 4 80 

AGCACCAGAA GATAAAATTG ATGGCGAATT TACGATTATT CGTCGCGGTA AGAAAAAATA 540 

CTTCATGGTT AACTATCAAT AAATATAATT GCATAGCTAA ATAAATTAGA GCCTACTCAT 600 

ATTCATTCCT AAGAATGTAA TGAGTAGGCT CTTAATGTAC TTTTCTGTCT GTAAATTATC 660 

XAAAGAAATC TCTATCGCCT TGGCCAGGTG ATTGACGTTC TGATCGGCTT TGACGTTTTG 720 

GTTGTTCTTT TTGTTGTTTT AATTTCACTT TAACTTCTTT TGTTTTACCA TCACGGATAA 780 

CGGTAACAGT GACTGATTCA CCAGGTTTTT TATTTTCATA TAAATAGCTT CTTAAATCAA 840 

CATCATCTTT AATTTTCTTG CCATCAATTT CTGTAATAAT ATCACCTTTT TTAAGATCAA 900 

TATCACTATC AGCTTTGGCG ACATAAATAC CGTCTTCTCT ATCAGTATGA AGTTGCTCGC 960 

GCTCTTCTTC AGGAATATCT TTCAAATTAA TTAAACCAAT ACCAATCGAA GGGCGGTCAA 1020 

TTTTACCATG TTTTACAAGT TGTTCAATTG TTACTTTAAC TTCATTACTT GGAATAGCAA 1080 

ACCCGATACC TTCAACTTGT GTCGCAGCAA TTTTCATTGA GTTAATACCA ACTAAATTAC 1140 

CATTAATATC TACTAATGCG CCACCTGAGT TACCTGGGTT AATAGCAGCA TCTGTTTGAA 1200 

25 GAACGCTAAC TTTTGTATTG CCACCAGTTG TCTCAGCGTC AATCGTACGT TCGCTTGCTG 1260 

AAATGATACC AGATGTTACA GAGTTAGCAA ATTGTAATCC TAATGGGTTA CCCATTGCGA 1320 

ATACGCTATC GCCAGTTTGT ACTTTTGAAG AGTTGGCAAA TTGAATCGCT TTAATACCTT 1380 

30 TTGTATTTTC AATTTTAAGT ACAGCAA7AT CAGTTACTGC ATCTTTACCA ACTAATTTCG 1440 

CTTTAACTTG TTTTTTATTA TGTAATTGGa CTCTAATTTC ATTTGCGCCA TCAATAACAT 1500 

GATTGTTTGT AACGATATAA GCTGAATTGT TGTTTATTTG aTAGATAACA CCTGAACCTA 1560 

CTCCAGCTTC AGATGGTTTA GATGATTTGC CyTTTAATAA GTCGTCTACA CTTGATGCTT 1620 

TTtGCATGTk AATAACTCCA ACAATTGTAG GGGAGACAGA TTTTATCATT TCATGAACGG 1680 

TACCGAATTT CTTGCTTTGA CCGTCTAATT GATTGCCACC TTTATTATTT GTTGTCTGAA 1740 

CAGTTGAACC ATCTTTATTT AAAATTGTAC TATTTAATAC TTTGCCTATA CCAAGTACTA 1800 

GAAGTGCACC AATAATTCCA GCAATCAATG CAACGATGAC TGTnTTAAAC CATGGAAATT 1850 

TAGGTCTTCT GTATCTAGGT GTTTGGCTAT GGTTTGTTGT AGAATGATCT GTATGATTAA 1920 

AATCTGACAT ACTTAACCTC CATTATATGA TTTATATATG CTTTAATTAT GTCTTTTnTT 1980 

TATAATT 1937 

SO (2) INFORMATION FOR SEQ ID NO: 523: 

Ci) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1351 base pairs 

55 
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(C) STRAMDEDNESS : double 

(D) TOPOLOGY: linear 



5 





(xi) SEQUENCE DESCRIPTION: 


SEQ ID NO: 


523: 








TTAGAAGTCA AATCATTAnT 


GGCGTCnTAT 


CGAGTATACT 


ATTAACTTCA ACTATTTTAG 


€0 


10 


CAATTGCATA TATTTTAATG 


TGGTTTAAPG 

AUwA X XAA^VJI 


GCCATATGAC 


aCTAACTTTG 


ACCTTAACGA 


120 




CAATAATTAC AAGCTGTTTA 


APCTTATTA A 

AVvSvX XaX a/U\ 


TATGTAGTAT 


TTTTATTAAT 


CCACTTATAC 


180 




AAAAAATTAA GCAGTTTAAT 


AT A A JX & 2V or a. 


AGCAATTTGC 


TAACGGAAAT 


TACGCAAGCA 


240 


15 


ATGATAAAAC GTTTAATTf!A 




TTTATGAATT 


AAATCAATCT 


TTTAATAAAA 


300 






P Ml ^ TV* Ik HIT' 


AAATTAAATC 


CGAACAACAA 


GAAAAAACAG 


360 




AArTGATTrA AAAPTTACyr' 


VrAlljiii i Xi\A 


AAACACCTTT 


AGCAAGCATT 


ATTTCATATT 


420 


20 


CTGAAGGACT ArGTGATfV5T 




AGGATCATGA 


GATTAAAGAG 


TCATACGACA 


480 




TATTAATTAA ACAAGCAAAC 


A w<n X X A X ^mAA 


CATTATTTGA 


TGATATGACT 


CATATTATCA 


540 




CTTTAAATAC AGGTAAAACA 


X AX V«V«V*^CaV9 


AATTAATACA 


ACTAGACCAA 


TTACTTGTAT 


600 


25 


CAATATTGCA ACCATATGAG 




AACAT6AAAA 


CCGCACATTA 


GAAGTGAATT 


660 




TCTGTAACGA AATTGATGCA 


XXX XaXVmAAX 


ATCGAACGCC 


ACTTGAGCGT ATTTTAACAA 


720 


30 


ACTTACTTGA TAATGCGCTA 


AA ATTTTP A Ji 

AAAX X A X Si«AA 


ATGTTGGTAG 


TCGCATTGAT ATTAATATTA 


780 


GTGAAAACGA AGATCAAGAT 


ACTATCGACA 

•^W AAA V« VIA^iA 


TTGCTATTAG 


CGATGAAGGT 


ATTGGCATTA 


840 




TACCAGAACT ACAAGAACGT 


ATATTCGAAC 


GTACATTCAG 


AGTAGAAAAC 


TCTCGTAATA 


900 


35 


CAAAAACGGG TGGTTCTGGA 


TTAftftfTT ^T 

X XAV9VJV*A XaX 


ATATAGCTAA 


TGAACTCGCG 


CAACAAAATA 


960 




ACX3CAAAAAT CAGTGTAAGC 


AGTGATATAG 


ATGTAGGAAC 


TACGATGACT 


GTAACATTAC 


1020 




ACAAATTAGA CATTACGTCA 


TAATCCGATT 


TATTTATAAA ATAAAATGCA AAGACTAAAA 


1080 


40 


AGAAGCTCCC ATTAATGAGG 


GCTTCTTTTT 


TTGTTTATTT 


AGAATAAACT 


TTATGGGTAT 


1140 




CCTTCTCATC ATTTTCAAGA 


CTTGAAAGAT 


TTGTAGCTTG AATAATATAT TTAGGACGTG 


1200 




CCTTAACTTC ATAATATATC 


CTGCCAATAT 


ATTCACCTAC 


AACACCAATT 


GAAATTAACr 


1260 


45 


GTATGCCGCC TAATAATAAA 


ATAGCTGCAA 


TCGTTGAAAA 


ATATCCCGGA ATATTAACAC 


1320 




CAGATATCAT AATATTGATG 


GAATAAATAG 


A 






1351 




(2) INFORMATION FOR SEQ ID NO: 524: 









(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 433 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 524: 

TTGTTGTCAG TTTAACGCAA CGTGTTACCG ACTTTTCAAG TACACAAcAA TATATATGTC 60 

S 

TATTCCATTT TTAGCCCcTG CCATTTTCAT CATTGGTGGT ATTATGTTGT TTATTTCAAC 120 

ATTTAATAGC TTAGATGAAA CTGCTGAAAA TAATAACAAA ATAAAGAAAC TAATGATTAA 180 

AGGACTTATC ATTATTAACA TTTCATTTAT CGTTATGATG GTTTTAACAC CATATTGGTA 240 

CTTGTATTTA ATCGTCTATC TTATTTTCTT GTTGTTTTTA TTGTX5GCAAA AGGTTTATAA 300 

ATTTTAATAC CAAAACTATT AAACACTTCT GATATTCTTA GTTCAAAATA TCAGAAGTGT 360 

15 TTTATAGTGT TATCTAGTTC AGATAAATAT TTCCTTACTT AAAAAAACGC CCTCCTCTTA 420 

TTTTGACCCC nAT 433 



(2) INFORMATION FOR SEQ ID NO: 525: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1845 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

25 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 525: 
CCCCCACTAT GATATGCTTG GCCTATTGCG TCAATCCCCT TATATTTCGG CAATAGAGAT 60 

30 

GGATGTATAT TCAATATTTT ACCTTCAAAT GAAGCTAATA AGTCTGGACC AATTAGACGC 120 
ATGTAGCCAG CTAGAATAAT CCACTCTACC TTATCTTCAT TTAATAATGT TACTAAATGT 180 
TGTTCATACG CTGCTTTTGA ATCAAATTGT TTTGGTTCAT TAATATAAAC AGGAATATCG 240 

35 

TGCTTTTTTG CTCTATCTAT ACAAAACGCA TTTTGATGAT CCGTATATAG CGCCGTAACT 300 
TCAATATTTT CAAGTTTTCC TGATTCAACA TGCTCAACTA TATTTkCAAA GTTACTTCCT 360 
GAACCTGATG CAAAAATCGC AATTTTAACC ATTGTTATAC CCCCAACAAT TCAATTGCAG 420 
TTGACTCATT TTTCACAATA TGACCAATTT GATAGGCTTC CACATTTTGT TCTGCTAAAA 480 
TCTTCAAAGC GCGTGATACA TCTTTTTCAT CAACGATAAC CGTATAGCCA ATACCCATAT 540 
45 TAAAAATGTT ATACATTTCA TTTGTGTCTA TATTGCCTTG TTGTTGTAAC CAATCAAATA • 600 

TTTTTGGTGT TGGAAATGAT GTAGTATCAA TTCTAGCAGC ATATCCGGCT GGCAATGCAC 660 
GTGGAATATT TTCATAAAAA CCTCCACCAG TAATATGATT CATTGCCTTA ATAGAAACTT 720 

so 

CTTTTTTCAA AGCAAGTACA GGTTTGACAT ATAATTTAGT TGGTTCTAAA AAGACATCGA 780 
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GCACTAAACT GTATCCATTT GAATGAATGC CACTTGACGC AAGCCCTATA ACAACTTGTC 900 

CCTCTTTCAC TTCTGAACCA TCTACATAGT CATCCTTTTC AACTGCTCCA ACAGCAAATC 960 

CAGCTACATC ATATTCGCCT TCGTGATACA TTTCACCCAT TTCAGCAGTC TCTCCACCGA 1020 

TAAGTGCAGT ATTCGTTTCA ACACATGCAT CACTAATACC TTTAACAATT TGTTCAATAA 1080 

CTTCAGGAAC AACTTTGTTT GTAGCAATGT AATCTAAAAA ATATAATGGT TCTGCACCTG 114 0 

TCGTTAAAAT ATCATTAACA CACATTGCGA CTGCATCGAT ACCTATCGAA TCATGTTTAC 1200 

CATAGTCGAT AGCTAGTTTT AATTTCXSTAC CTACTCCGTC TGTTCCAGAA ACTAAAACTG 1260 

GCGCTGtCAT ATTTAATTGT GATAAATCAA ATGTAGCACC GAATCCACCT AAACCACCGA 1320 

TAACTTCTTT ACGCATCGTA COtTTAACaw GaCtAGaCaT TCtTTCtACA GCTTCATAAC 1380 

CAGCATGAAT ATTTACACCA GATTGTTCAT ATGCTTTAGA CATTTAAATT TCCCTCGCTA 1440 

TCAAAAAAGT GTTTGTT T TT AGAAATATAT TGCTTTTGTC GATGACTTAA ATGCGCTTTA 1500 

TAATTTGCTT CATAATCATA TAACCCTGCA GGATAATCTC CAGTGAAACT TTCTACACAT 1560 

AAGCCACTAT ATGGCGCGTC ATAATCTAAA CCAATTGATT CAATTAACCC ATCTACAGAT 1620 

25 AGATATGCTA ATGAATCAGC GCCAATATAA TCTTTAATTT CTTCAGGTGA TTTGCTTGCA 1680 

GAAATTAATT CTGCCGTAGT TGAAACATCG ATTCCGTAAA AACTTGGAAA CATAAATTCC 1740 

GGTGATGCTA TACGCACATG CACTTkATTT GCACCAGAAT CkTTrAACAT TTTCACAATG 1800 

3^ CGTCGAATTG TCGTACCGCG nACAATGGAA TCATCAACAA GACTG 1845 
(2) INFORMATION FOR SEQ ID NO: 526: 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1141 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 526: 

TCATAAATnG TAAATGTTAA TCGTCATATA ATATTAATTT ACAACACCAT TTTGGTTATT 60 

TGAAGCTTGT GGCGCTTGTT GTGTGCCACC TTGATTTTGA TTTGAGTTTT GATCTGTAGC 120 

AGGTTGTTGT TGATTGCTGG AratCACTGTT ATTAGTTGAm TCACTGTTCT CGTTAGATGT 180 

CTTATCTTTA TCTGTCGTAT CATTTTGTTC TTTTCTCAAT AAACTATTAT CTAAAGGCGT 240 

TAATGGTATT AATGAACCAT AATGATTAAT GACACGTTGA TCTAAGAAAT CATTTTTATC 300 

ATTAATAGGT GATAATTCTA AGTCTTTACG AAGTAAGTTT GCATATTTTT GAATGCTTTC 360 
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GATTAAGTAT ATAGAGCACT ATTTTGTATT TGTTAATATT TTCACAAAAA TAAAGCCTTG 720 

ATAAATTTTA AAATATAATT AAGCTCAATT TTTAAAATTT TATTTAGCTA CAGATAACAT 780 

TTTTAAAAAA GAAAAGAATC AATAAATAAA ATCAACGAAC AAAAAGTATA GAAATAAATA 840 

GAAATAATCA TTTACTTTTC TGAAAAATTA AATTAATATT TTATTTATAA GCTGTTTTTA 900 

AGATTTCAGG AGGAATGAAA TGTGaGGAAA TTTTCAAGAT ATGCATTTAC AAGTATGGCA 960 

GCATTAACCT TGTTGAGCAC TTTATCACCA GCAGCATTAG CGATTGATTC AAAAAATAAA 1020 

CCAGCTAATT CTGATATTAA ATTTGAGGTG ACTCAAAAGA GTGATGCGGT CAAAGCATTA 1080 

AAAGAATTGC CTAAATCCGA AAATGTAAAA AATATTTATC AAGATTACGC TGTTACTGAT 1140 

GTAAAAACTG ATAAAAAAGG ATTTACGCAT TATACATTGC AACCGAGTGT TGATGGTGTT 1200 

CATGCACCTG aCAAAGAAGT GAAAGTACAC GCAGACAAAT CAGGAAAAGT CGTTTTAATC 1260 

20 AATGGGGATA CTGATGCGAA GAAAGTAAAG CCAACGAATA AAGTGACATT AAGTAAAGAT 1320 

GACGCAGCCG ACAAAGCATT TAAAGCAGTT AAGATTGATA AGAATAAAGC GAAAAATCTT 1380 

aAAGATAAAG TCATTAAAGA rAACAAAGTT GAAATCGATG GTGACAGTAA TAAATACGTT 1440 

TATAATGTTG AGTTAATTAC AGTGACACCA GAAATTTCAC ATTGGAAAGT TAAAATTGAT 1500 

GCTCAAACTG GCGAAATTTT AGAAAAAATG AACTTAGTTA AAGAAGCTGC AGAAACTGGT 1560 

AAAGG 1565 
(2) INFORMATION FOR SEQ ID NO: 52B: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2870 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



25 



30 



45 



40 (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 528: 

GGATAGGTAA ATCCATTCAA AATTGGTTGT ACTCATTTTA AATCATATTT TTTAATATAG 60 

AAACACATAA TTAAAGGAGT GATGATATTA ATGAATAAAC TTCGAGACAC TACTTTTCTA 120 

TCATATTTAT TTACTATCAT ATTGTGGGGA TCTGCATTTC CAATGATAAA GATTGCGTTA 180 

AATGATTTTA GTGCAGAATC ATTGTCGGCA TTTCGTTTAA TTTTAGCAAC AATAATTCTC 240 

TTGCCGTTCG. TAATTATAAA GAAATTGCCT ACCCCTGAAC TAAGAGATAT CCCTGTTATT 300 

TTTATTTTAG GATTTTGTGG ATTTGTGATA TATCACACAG CTTTAAATTT TGGTGAAaCT 360 

TTGATTAGTG CAGGTATAtC TGGrATTCyA GTCTCTACAA CGCCTATTTT TTCTAGTGCT 420 
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GCATTTATAG GAATATCCAT TATTTCAATA AGTAAAGATG ATTACACAAC TATTAATGTA 54 0 

TTAGGTGTTT TTATTATTTT ACTTGCATCT TTTAGTGAAA GTTTGTATTT TACTTTCCAG 600 

5 

AAAAAATACA TAGAAAAATA CGGCTTCATC GCTTTCACAC TATaTACAAT AATGGCAAGC €60 

TCACCATTTA TGCTTATTTT TATTCCTGAA ATCATCAACG ATATACACGG CGCCACTTTT 720 

ACATCAATAG TATCGGTACT TTATTTAGCT ATATTCCCTA CTATAATTCC ATACGTTTTG 780 

10 

CTTGCTTATA TTGTGAAGTC AGTTGGTGTC TCTGATGCAA CAATGTCTCT TTATTTAACA 840 

CCTATCGTTT CTTTATTATT ATCTTATCTG TTATTAGACG AGCTACCAAC AACCCTTGCT 900 

,5 ATTATAGGCG GAATTATCAC TCTACTAGGC GTTAGTTTAA GTAACTTCTT TCAAAATACA 960 

TAATTATTCC AAGTCCCGCA CCTCAGAATC CAAAAACATT CGAGTGATAA AATTTTAAAA 1020 

ATCAAAAATA TAAAAATGAT CTAATTTCGT CAAATTTACC AATATAAATA CTAATATTTG 1080 

20 CAATTCACAA AGGGGTATAG TCTGAGTGTA TTCTAATACG AAAGGACTTG GTGGATATGT 1140 

ATTACAGTTA TGGAAATTAT GAAGCATTTG CGCGCCCTAA AAAACCTGAA AATGTAGAAA 1200 

ACAAATCCGC TTACTTAATC GGATCTGGTC TAGCTTCACT TGCTGCAGCT TGTTTTTTAA 1260 

25 

TAAGGGATGG TCAAATGGAA GGTTCGAAGA TTCATATTTT AGAAGAGTTA CCTAAAGCAG 1320 

GTGGTAGTCT TGATGGTGAA AATATGCCTT TAAAAGGCTA TGTTGTCCGC GGTGGTCGTG 1380 

AAATGGAGAA CCACTTTGAA TGTTTGTGGG ACTTATTCAG ATCTATCCCT TCATTAGAAA 1440 

30 

TCGATAACGC GTCTGTATTA GATGAGTTCT ATTGGCTAAA CAAAGAAGAC CCTAACTATT 1500 

CTCGCTGTCG TGTTATTGAG AAACAGGGTC AACGTTTAGT CACAGACGGA GACTTCACTT 1560 

35 TGACTAAAAC GGCGATTAAA GAAATTTTAG ATTTATGCTT AACGAATGAA GAAGATTTAG 1620 

ATGATGTCAA AATAACAGAT GTATTTTCCG ATGACTTCTT TAATTCAAAC TTTTGGATTT 1680 

ACTGGAAAAC GATGTTTGCA TTTGAACCGT GGCATTCTGC AATGGAAATG CGTCGCTATC 1740 

40 TAATGCGATT CGTTCATCAT ATTAGTGGTC TCGCAGACTT TTCAGCTTTA AAATTCACTA 1800 

AATATAATCA ATATGAATCT TTAGTATTAC CTATGGTTGA ATATTTAAAA TCGCATGGGG 1860 

TTCAATTTGA ATACGATGTA AAAGTCGAAG ATATTAAAAT AGATGTTACG ACAAGTCAAA 1920 

45 

AAATTGCCCG AGAAATATTA ATTGACCGTA ATGGTAATGC AGAATCTATT AAACTGACTA 1980 

TAAACGATCT TGTCTTTGTG ACAAACGGTA GTATTACAGA AAGCTCTACT TATGGTGATA 2040 

ATGATACACC AGCGCCACCA ACTGACGAAT TAGGTGGTAG TTGGACACTA TGGAAAAATT 2100 

SO 

TAGCGCGACA AAGTCCTGAA TTTGGTAATC CTGATAAGTT TTGCCAAAAT ATTCCTAAAA 2160 

AAAGTTGGTT TGTTTCAGCA ACTTCTACAA CAAACAATAA AGAGATTATC GATACAATAG 2220 
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TCAATGATTC TGCATGGCAA ATGAGTTTTA CAATCAATCG TCAGCAACAG TTTAAAGACC 2340 

AACCTGAAAA TGAAATATCT ACATGGATTT ATGCCTTATA TTCAGATGTA AACGGCGATT 2400 

^ ATATTAAAAA GCCAATTACA GAATGTAGTG GTAATGAAAT ATGCCAAGAA TGGCTGTATC 2460 

ACTTAGGTGT ATCAACTGAC AAAATTGAAG ACTTAGCAAA ACATGCATCT AATACGATTC 2520 

CTGTTTATAT GCCATATATC ACATCTTATT TCATGACGCG TGCTATCGGC GACAGACCTT 2580 

TAGTCGTCCC GCATCAATCT CAGAACTTAG CATTTATTGG TAACTTTGCA GAAACAGAGC 2640 

GAGACACTGT ATTTACAACA GAATATTCGG TTCGTACTGC CATGGAAGCT GTTTATCAAT 2700 

TACTAAATAT AGATCGTGGT ATTCCAGAAG TCATCAATAG TCCATTTGAT CTTCGCGTCT 2760 

TAATGGATGC CATATACGAA CTGAATGACC ACCAAGATTT- GCGTGAGATT ACTAAAGATT 2820 

CGAAAATGCA AAAACTCGCA TTAGCAGGAT TCCTTAAAAA GATAAAAGGT 2 870 
20 (2) INFORMATION FOR SEQ ID NO: 529: 



75 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3105 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNES5: double 
2^ (D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: : 

30 

CnGTTTAGCT GCAAAAAGTA AATAACGACA 
TTTTGGGTGA CATTAACTCA ATTTTCAGCG 
AAGAAATTTT AATTTTACTA ACTTTATGGC 

35 

ACAGATTTGT TGAAGTTAAA CCGTATAAGC 

TAGAATGGAT TTACAAAGAG CGTCCTGTTG 
ATGAAAAGTT ACAACAAGAG AAAGTAGAGT 
GTAGAGCAAC AGCAATGCAA AATAGTTTAA 
ATAAAAAGAG GTTTTCATTA AGTTGAAAAC 
^ ATGTTGACTA CTCAATCCTA AATTATAAAT 
TTCTATGGCA CAAATGAATG GAGCATGATT 
TTGCGCATGC TTTTGATCCA AAGTACTCAA 

SO 

TCCTTCGCTA TGACCATGAT ATATAACAAG 
TAGCAATGAA TTAATAGCTT GGATTGTCGT 

55 



;EQ id NO: 529: 

CTGTATTTGG AATTTTGCAA TTAGAAACAC 60 

AGATTGAAAG CGAATACAAA ATGTCTAGAG 120 

AAAAAGGTTC TATGACGCTT AAAGAAATGG 180 

GTACGAGAAC GTATAATAAT TTAGTTGAAT 240 

ACGATGAAAG AACAGTTATT ATTCATTTCA 300 

TGTTGAATTT CATCAGTGAT GCGATTGCAA 360 

ACGCAATTAT TGCTGTGTAA GTTTAATAGC 420 

CTCTTTTTGT TGTTGGCATT AATTTTTCAA 480 

AGTATAGCGC aCAAaTGCTT AAGAAATTTT 540 

ACGTTGGTTT AAAAATTGAT ATTGCAAAAC 600 

GTAATCAAGC AATGCATGCT TCTCAATTTG 660 

TACAATAATA CCTTCAATTG ACATTAATGA 720 

GTCAGGCTTT GTCACGATAG ATTTATCACC 780 
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ATCTTATTAT GTATGTTGTG TTTGCGCTTG TCGCGGTAAC GCAATTTAAT ATTGAAATTA 2700 

ATGCGAAAGT TAAATATCCA ACTCATTTAG ATATTACTGG TAAAAAGAAT AAAGCAAGAT 2760 

TTATTTCATT AGTACTAATT TGTGCAATGT TTGCAATTTG TTGGGTTGCA TATATTCAAT 2820 

GGGAGTCTAC AATCGCTTCA TTTACACAAT CTATTAATAT TTCAATGGCA CAATATAGTG 2880 

TTTTATGGAC AATTAACGGA ATAATGATTT TAGTAGCACA ACCATTAATT AAACCGATTC 2940 

TCTATCTGTT AAAAGGAAAC TTAAAGAAGC AAATGTTTGT CGGCATCATC ATTTTTATGT 3000 

TGTCGTTCTT TGTCACGAGT TTTGCCGAAA ACTTTACAAT ATTTGyTGTC GGTATGATTA 3050 

TTTTAACm TGGAGaATGT TTGTATGGCC AGCAGTTCCA ACTAT 3105 
(2) INFORMATION FOR SSQ ID NO: 530: 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 5532 base pairs 
20 (B) TYPE: nucleic acid 

CO STRANDEDNESS : double 
(D) TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 530: 

TAATGATTAA ACCAGATGCA GTACAAAGAA ATCTAATTGG TGAAGTAATT TCAAGAATTG 60 

AAAGAAAAGG ACTAAAACTT GTCGGTGGTA AATTAATGCA AGTACCAATG GAACTTGCTG 120 

AAACACATTA TGGTGAACAC CAAGGTAAAC CATTTTATAA TGATTTAATT TCATTTATTA 180 

CATCAGCACC AGTGTTCGCA ATGGTAGTTG AAGGTGAAGA TGCAGTTAAT GTATCTAGAC 240 
ATATTATTGG CAGCACCAAT CCTTCAGAAG CTTCACCAGG ATCAATTAGA GGTGATTTAG - 300 

GTTTAACTGT TGGTAGAAAT ATCATTCACG GTTCAGATTC ATTAGAGTCT GCTGAACGTG 360 

AAATTAATCT ATGGTTTAAT GAAAATGAAA TTACTAGCTA TGCTTCACCA CGTGATGCAT 420 

40 GGTTATATGA ATAAAATATA AACTGTAAAC CTTTACGATT TATTTATAAA GGTAGAAAGG 480 

GTTTTGTTAT GTGGTTAGTC ATTATGaTTA TACATAACAA GGCCCGTTTT TTATGTTGTA 540 

GTAAATTACT TGAAAAATTT TATAGTTTTT kGGTAAcACG TAtTaAAAaG AGAGGAATAT 600 

TCTTTATCAA ATGAAACTAA ACAGAGAGAA GGGGTTGTTA AAATGAAgAA TATTATTTCG 660 

ATTATTTkGG GGATTTTAAT GTTCTTAAAA TTAATGGAAT TACTATATGG TGCTATATTT 720 

TTAGATAAAC CACTTAATCC TATAACAAAA ATTATTTTTA TACTGACTCT CATTTATATT 780 

TTTTATGTAT TAGTAAAAGA ATTGATTATA TTTTTGaAGT CAAAGTATAA CAAAAGCGCT 840 

TAACATATGT ATATTTTAAT ATCATAATTT TTTTAAACGG ACTGATTAAC TTTATTAATA 900 
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10 



GATACGATTA TATTAAAACG GCTAATCATT TTTAATTAAT GATTATATGA TGCAACTGTT 
TAGAAATTCA TGATACTTTT CTACAGACGA ATATATTATA ATTAATTTTA GTTCGTTTAA 
TATTAAGATA ATTCTGACAT TTAAAATGAG ATGTCATCCA TTTTCTTAAT TGAGCTTGAA 
AACAAACATT TATGAATGCA CAATGAATAT GATAAGATTA ACAACATATT ATAATGTTAT 
CGTGGAAGTA TGAAAGGAGC GAGTGTGTAT GAGATACCTA ACATCAGGAG AATCACATGG 
ACCTCAATTA ACAGTTATTG TTGAAGOTGT ACCTGCAAAT ATAGAAATTA AGGTTGAGGA 
TATTAATAAA GAAATGTTTA AGCGTCAAGG CGGTTACGGA CGTGGACGTC GTATGCAAAT 
TGAGAAAGAT ACAGTAGAAA TAGTATCAGG CGTTAGAAAT GGTTATACAT TAGGTAGTCC 
AATTACTATG GTTGTAACCA ATGATGACTT TACGCATTGG AGAAAAATTA TGGGAGCAGC 
TCCAATAAGT GAAGAAGAAC GTGAAAATAT GAAACGTACT ATTACAAAAC CAAGACCTGG 
20 TCATGCAGAT TTGGTTGGAG GTATGAAATA TAATCATCGT GATTTACGAA ATGTGCTAGA 
GCGATCATCT GCTAGAGAAA CAGCAGCTCG AGTTGCAGTC GGTGCCTTAT GTAAAGTGTT 
ATTACAACAG TTAGATATCG ATATATACAG TCGTGTTGTT GAAATAGGTG GAATTAAAGA 
TAAAGATTTT TATGATTCAG AAACATTTAA AGCAAATCTT GATCGTAATG ATGTTCGTGT 
AATTGATGAC AGTATCGCAC AAGCAATGCG AGATAAAATT GACGAaGCTA AAAATGAAGG 



15 



30 



35 



AGATTCAATT GGCGGTGTCG TTCAAGTTGT AGTTGAAAAT ATGCCTGTTG GTGTAGGTAG 
TTATGTGCAT TATGATCGTA AGTTAGATGG TAAGATTGCA CAAGGTGTTG TCAGCATAAA 
TGCTTTTAAA GGTGTAAGCT TTGGTGAAGG ATTTAAAGCA GCTGAAAAGC CAGGTAGTGA 
GATTCAAGAT GAAATTCTAT ATAATAGTGA AATTGGTTAT TATCGTGGAT CTAATCACTT 



^ G ' i ' GU ' I 'lTA'GflAG G CGG TA T GTCAAATGG "SATGCCfiATT""ATCGTTAATG "GTGTAATGSA ' 
CCAATTCCA ACGTTATATA AACCATTAAA TTCAGTAGAC ATTAATACTA AAGAAGACTT 
AAAGCAACA ATTGAACGTT CTGATAGTTG TGCTGTTCCT GCAGCAAGTA TCGTCTGCGA 
CATGTCGTA GCATTTGAAA TAGCAAAAGC ATTATTGGAA GAATTCCAAT CAAATCATAT 
3AGCAACTT AAACAACAAA TTATTGAGCG CAGACAATTA AATATTGAGT TTTAACAACA 
3AACAATTG AGGTGTAATC ATGAAATTAC AAACAACATA CCCTTCAAAT AATTATCCAA 
ATATGTTGA ACACGGTGCA ATTGACCATA TTAGCACGTA TATTGATCAG TTTGATCAAA 
rrXTATATT AATTGACGAG CATGTAAATC AATATTTTGC TGATAAATTT GATGATATTT 
ATCATATGA AAATGTACAT AAAGTTATTA TTCCAGCTGG TGAAAAGACG AAAACATTTG 
3CAATATCA AGAAACATTA GAGTATATTT TATCCCATCA TGTAACTCGT AATACAGCAA 



2220 
2280 
2340 
2400 
2460 
2520 
2580 
2640 
2700 
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1380 

1440 

1500 

1560 

1620 

1680 

1740 

1800 

1860 

1520 

1580 

2040 

2100 
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ACGAGGCGTG CACTTTATAC AAGTGCCAAC GACTATACTA GCGCATGATT CTAGTGTTGG 2820 

CGGTAAAGTG GGTATTAACT CAAAGCAAGG TAAAAACCTT ATCGGTGCAT TTTATCGTCC 2880 

AACTGCTGTG ATTTATGATT TAGTCTTTTT AAAGACGTTA CCATTTGAGC AAATATTAAG 294 0 

TGGCTATGCA GAAGTTTATA AGCATGCGTT ATTGAATGGT GAATCAGCGA CGCAAGATAT 3000 

CGAACAGCAC TTTAAAGATA GAGAGATATT ACAGTCATTA AATGGTATGG ATAAATATAT 3060 

TGCTAAAGGT ATTGAAACGA AGCTGGATAT TGTTATTGCA GATGAAAAAG AACAAGGTGT 3120 

ACGTAAATTT TTAAATTTAG GTCATACATT TGGTCATGCT GTTGAATACT ATCATAAAAT 3180 

ACCTCATGGT CATGCAGTGA TGGTTGGCAT TATCTATCAA TTTATAGTTG CGAATGCTTT 3240 

GTTTGATTCT AAGCATGATA TTAAXCATTA TATTCAATAT TTAATACAAC TCGGCTATCC 3300 

TTTAGACATG ATAACTGACT TGGATTTTGA AACGTTATAC CAATATATGC TAAGTGATAA 3360 

20 AAAGAATGAT AAGCAAGGTG TACAAATGGT CTTGATTAGA CAATTTGGAG ATATCGTTGT 3420 

ACAACATGTT GATCAACTAA CATTACAACA TGCATGTGAA CAATTAAAAA CATATTTTAA 3480 

GTAGGTGAAT GAAATGGTAA ATGAACAAAT CATTGATATT TCAGGTCCGT TAAAGGGCGA 3540 

AATAGAAGTG CCGGGCGATA AGTCAATGAC ACACCGTGCA ATCATGTTGG CGTCGCTAGC 3600 

TGAAGGTGTA TCTACTATAT ATAAGCCACT ACTTGGCGAA GATTGTCGTC GTACGATGGA 366 0 

CATTTTCCGA CTGTTAGGTG TAGAAATCAA AGAAGATGAT GAAAAATTAG TTGTGACTTC 3720 

CCCAGGATAT CAATCTTTTA ACACGCCACA TCAAGTATTG TATACAGGTA ATTCTGGTAC 3780 

GACAACACGA TTATTGGCAG GTTTGTTAAG TGGTTTAGGT ATTGAAAGTG TTTTGTCTGG 3840 

CGATGTTTCA ATTGGTAAAA GGCCAATGGA TCGTGTCTTG AGACCATTGA AACTTATGGA 3900 

TGCGAATATT GAAGGTATTG AAGATAATTA TACACCATTA ATXATTAAGC CATCTGTCAT 3960 

AAAAGGTATA AATTATCAAA TGGAAGTTGC AAGTGCACAA GTAAAAAGTG CCATTTTATT 4020 

4Q TGCAAGTTTG TTTTCTAAGG AACCGACCAT CATTAAAGAA TTAGATGTAA GTCGAAATCA 4080 

TACTGAGACG ATGTTCAAAC ATTTTAATAT TCCAATTGAA GCAGAAGGGT TATCAATTAA 4140 

TACAACCCCT GAAGCAATTC GATACATTAA ACCTGCAGAT TTTCATGTTC CTGGCGATAT 4200 

TTCATCTGCA GCGTTCTTTA TTGTTGCAGC ACTTATCACA CCAGGAAGTG ATGTAACAAT 4260 

TCATAATGTT GGAATCAATC CAACACGTTC AGGTATTATT GATATTGTTG AAAAAATGGG 4320 

CGGTAATATC CAACTTTTCA ATCAAACAAC TGGTGCTGAA CCTACTGCTT CTATTCGTAT 4380 

SO 

TCAATACACA CCAATGCTTC AACCAATAAC AATCGAAGGA GAATTAGTTC CAAAAGCAAT 4440 

TGATGAACTG CCTGTAATAG CATTACTTTG TACACAAGCA GTTGGCACGA GTACAATTAA 4500 
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AAACTTGTTA GGGTTTGAAT TACAACCAAC TAATGATGGA TTGATTATTC ATCCGTCAGA 4620 

ATTTAAAACA AATGC7VACAG TTGATAGTTT AACTGATCAT CGAATAGGAA TGATGCTTGC 4680 

AGTTGCTTCT CTACTTTCAA GCGAGCCTGT CAAAATCAAA CAATTTGATG CTGTAAATGT 4740 

ATCATTTCCA GGATTTTTAC CAAAACTAAA GCTTTTAGAA AATGAGGGAT AATATAAAAT 4800 

GGAAGATATC TATAAATTAA TAGACGATAT CAATCTACAA AAACTAGAAA ATTTAGACTC 4860 

TCGTGTTAAT GAAGCAATAA CTACTGACAA CGATGACGCA TTATTTATTC TAGGAGAGAC 4920 

ACTTTACAAT TTTGGATTAA TGCCaCAAGG TTTGGAAGTA TTCCGCGTGT TATATCACAA 49 80 

ATATCCAGAC GAAAGTGAAT TGCTGATTTA TTTTATTGAA GGTTTAATGT CTGAAAATCA 5040 

AACTGACGAA GCGTTAGAAT ATTTAAGTTA TGTTGAACCA TCACCTGAAA AGTTGATGTT 5100 

AGAAGCAGAT TTATATCAAC AAATTAATAT GATGGAAGTT GCTATTGATA AATTACAAGA 5160 

20 AGCACTTGAA CTAGAGCCAA ATGATCCAAT AATCCATTTT GCATTGGCTG AAATGTTATA 5220 

TTATGATGGT CAATATTTAC GTGCTACCTC TGAATACGAA ACCGTTTTAG AAACTGGTGA 5280 

ATATCAAGTT AATGGTGTAA ACTTATTCTC TCGTATGGCA GATTGTAGTT TACAAAGTGG 5340 

kAACTATAGT GATkCcGATC CgCTTATACG ATGrAATTAA TGAAGATGAA ATGACTTCAG 5400 

AAGATTATCT CAAAAGAGCC ATTTCTnACG ATAAAAATGA CATCACTCAA GAAGCAATTA 5460 

AAATAATGAC TACATTACTT TCTAAAGATC CTGATTATAT TC3\AgGCTAC TTGTATTTAC 5520 

30 

aATCaXTATA TG 5532 
(2) INFORMATION FOR S2Q ID NO: 531: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 942 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
CD) TOPOLOGY: linear 

40 

Ui) SEQUENCE DESCRIPTION: SEQ ID NO: 531: 
AATTGGGTTA TACTATAGGT AAATTTAAGG AGGTAAGAAA ATGGATAAAA AAGAATTAGC 60 
GAAATTTATA GGC^ATAAAA TCAGATACTA TAGAACCaAA TTGaACTTAA CTCAAGATCa 120 
ACTTGGAGAA AAACTCtnACa CTAAAAAtGC TACTATTTCA AATTATGAGA CAGGGTACAG 180 
AACTCCTAAA CAAGATGATT TGTTTGAAAT TGCTCATATT TTAAATATCA GTATCGATGA 24 0 

SO 

TTTGTTTCCT ACAAGAAATA ATAAAAAAAA CGACATCACT TCCATATACA ACAAACTCAC 300 
ACCTCCCCGC CAAGAAAACG TACTTAACTA CGCAAATGAG CAATTAGATG AACAGAATAA 360 
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AACTGGTGCT GGCATAGGAG AAGAATTATA TGATGACATA TTGCATGAAG AAGTATTTTT 480 

TAAAGAAGAC GAAACGCCAT CAAATGCTGA TTTTTGTATT TTAGTTAATG GTGATTCAAT 540 

^ GGAACCTATG TTAAAACAAG GAACATACGC TTTTATTAAG AAAGAAGATT CTATTAAAGA 600 

TGGTACAATT GCACTCGTTG TATTAGATGG AGTAAGTCTT ATCAAGCGTG TAGATATATG 660 

CGAAGACTAT ATTAATTTGG TATCTCTAAA TCCGAAGTAT GATGATATCA AAGTCGCTTC 720 

10 

GTTTAGTAAT ATTAAAGTAA TGGGCAAAGT TGTATTGTGA TTAATAGCGC CTATATGGCA 780 

CTTTAATATA AAAGACGTCT ATTTCAGCAG TGTTTAAAAG GAGTTTATAA TGAAAATAAC 840 

TAATTGCAAA ATAAAAAAAG AAACTATAGT ATATGAAGTT TTAACTAGTG GTAATCAACC 900 

15 

ATTCACTTAT GAGTTACCTA AAGATTTATC GTCACATAAT GC . 942 
{2} INFORMATION FOR SEQ ID NO: 532: 
20 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 417 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

25 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 532: 
TGGnAAATGC AAACCAAAAT ATGaTCCTCG TGcAAGTTGA AGCGGGACGT TATGAAGAAT 60 

30 

GGGTAAAGAA TGGTTATTTT AAACCGTCAG AAGATAAATC AAAAGAAACA TATACAATTG 120 
TTATCCCGCC ACCAAATGTA ACTGGTAAAT TACATTTAGG ACATGCATGG GATACGACTT 180 
TACAAGATAT CATTACACGT ATGAAACGTA TGCAAGGATA CGATACGTTA TACTTACCAG 240 

35 

GTATGGATCA TGCTGGTATT GCGACACAGG CAAAGGTAGA AGCTAAATTA AATGAACAAG 300 
GAATAACTAG ATATGATCTT GGTCGTGAAA AGTTTTTAGA ACAGGCATGG GATTGGAAAG 360 
40 AAGAGTATGC GTCATTTATT CGTGCGCAAT GGGCTAAATT AGGTCTAGGT TTAGATT 417 
(2) INFORMATION FOR SEQ ID NO: 533: 
(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 733 base pairs 
^ (B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



so 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 533: 
GATCCTGAAC CCGCATTTGT TTCCACTAAA ACAGTATGCC CACTTTCTAC TAAAGCGTGC 60 
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TAGAGCTTGA TTTAAATAAG TACCAACTAT 
ACTTGGTAGG TACTGAATCA AAGAAACGTG 
5 TAAATAGTAC TAGCGTTTAT TCAGTAATTG 
AAATCCACAA AGACTTTGTT GACTTAGAGC 
ACTACCTAAG TGCCTTACCC TACCAACTTA 

10 

ATATCGTGCT CTCCATTTCA CGTATAAAAA 
TTTATGATTC TGTACAAAAC ACATTTQAAC 
TTGGTCAAAT ATATGACGTC ACGTTTAATC 

15 

TACGTGGAGC TAAACGAAAA AATCTTAATG 
ACAAAATTAA AGCGTTTGTT AACAAAGTAG 

20 TGGATACTTT AGTAGATGGA CTGACGCTAC 
CTAATATCGA GACCTATAAT CCGTTAACAG 
TTGAAAATGT AAGATTAGCT TTAAATGATT 

25 AAATTGCTTT TATAGTtTTA CACTTTGGTG 
TAAACATATT AGTCGTTTGC AGCAGTGGTA 
TAGAGCAAGT TTTTAGTGAG ATTGAGCGTA 

30 

CACTAGATTT AAGTCAATAT GA7GGCATTA 
CCTATTTAAC GGTAAACCCA TTATTACCAG 
TAAATACAAA GTCTACGTTC CAAGAGACGC 

35 

ATGATGTTCA TGTTGAAACG AAAGATGTTG 
CTTCATACTT AACTTCAGTT TTCGAAAAAC 
TGCATCATAT GCGTTCGGGT TTAACTTTGC 
TTAAACAGTG GCAAACATAT ATCGCAGATT 
CAACGTCATT CGCTGAACTA CTAGAGCAAC 
45 GTCCATATCC TGTTGCAATA CCACACCTAA 
TAATCACAGT TTTAGAAGAA CCGTTAACAT 
TTAAATATAT GATTTCCATG TTTATTTCTG 

SO 

ACTTGTCCGA ATTTTTAAGT TTGAAATTAG 
AGGAACTTGA AACATTATTA AGAAACAAAT 
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CTTTATCTCG AAAGCGTGGC GAAGGCATTT 840 

AATTTTTAAG TCAATTAATG GTGAATAACT 900 

AAAATCATTT TGTCTTTCAT TCATTAAATC 960 

GCATTTTTAA TGTTGAAAGA CtATTaATGG . 1020 

CCGAATCAAG TTATTTAACT TTAACTGTCC 1080 

ATGGAGAGtA TGTCGCATTA AACGATGATA 1140 

ACAAAGTaGc AAGCGAACTT GCTGATAAAC 1200 

AGGCAGAAAT TGCTTTCATT ACTATCCATT 1260 

ATACATCATT AAATAATCGT TGTGAAGAAA 1320 

AAATGATTTC CGGTATGACA TTTGCAGATT 1380 

ACCTTAATCC TGCAATCAAT CGTTTGCAAG 1440 

ACATGATTAA GTTCAAATAT CCAAGACTAT 1500 

GTTGGCCTGA TTTGATTTTT CCAGAGAGTG 1560 

GCTCGATTAA AAACCAAGGT AATCGATTTT 1620 

TGGGAACTAG TCGTCTATTA TCAACTCGTC 1680 

TTACACAAGC ATCAGTCAGC GATTTGAAGT 1740 

TTTCTACTGT GAATTTAGAC ATCGACTCCC 1800 

ATAGTGATAT CAGTTATGTC GCACAGTTTT 1860 

ATGATAAATC ATCAAACATG ATTGATAAGG 1920 

ATGGCAACAC ATCTTTTGAA AATGAACAAA 1980 

ATTTAAGTGA CGAAAAATCA GAACAATTAT 2040 

TTGATTCAGT GAAAATAGTT AGTACCGAAG 2100 

ATCTATATCA ATGCGATGTA ATAAACGATC 2160 

GATTGATTGA CAATCCAGGA TGGATATTAA 2220 

GAGACAATAT GATTAAACAC CCTATGATTC 2280 

TGCCTAGTAT TCAAAATGAC AATCAAACAA 2340 

ACAATGATTT TATGGCATCA CTGGTAAGTG 2400 

AATCTATTGA TACTTTTATG GAAAATCCAC 2460 

TTTTAGAACG AATTAAAAAA CAATTTATTT 2520 



1467 



5 



15 



25 



EP0 786 519 A2 

TAACAGCCAA AATGAAGCAA TTGAAAAAGC AGGTAAAGCC TTAGTTGATA GTGGTGCTGT 2640 

AACAGATGCT TATATTCAAG CAATGAAAGA TCGTGAGCAA GTCGTATCAA CATTTATGGG 2700 

AAATGGCTTA GCAATTCCTC ATGGCACAGA TGAAGCTAAA ACAAATGTGA TTCACTCAGG 2760 

TTTAACATTA TTACAAATCC CTGAAGGCGT TGACTGGGAT GGCGAAGTAG TTAAAGTTGT 2820 

CGTGGGAATT GCTGGTAAAG ATGGCGAACA TTTAGACTTG TTATCTAAAA TTGCAATTAC 2880 

10 

ATTTAGCGAA GAAGAAAATG TGGATCGTAT CGTTCAAGCA AAATCTGCAG AAGAAATTAA 2940 

ACAAGTATTC GAGGAGGCAG ATGCATAATG AAAGCAGTTC ACTTTGGTGC TGGTAACATA 3 000 

GGTCGTGGTT TCATTGGTTA TATTCTgCAG ACAACAATGT TAAAGTAACA TTTGCAGACG 3060 

TCAATGAAGA AATCATTAAT GCTTTAGCTC ATGATCATCA ATACGATGTT ATTTTAGCTG 3120 

ATGAGTCTAA AACAACGACG CGCGTGAAtA ATGtTGATGC AATTAATTCA ATGCAACCTT 3180 

20 CTGAAGCGTT GAAACAAGCA ATTCTAGAAG CTGATATTAT TACAACAGCT GTTGGTGTTA 3240 

ACATACTACC TATTATTGCT AAATCTTTTG CGCCTTTCTT AAAAGAAAAA ACAAACCATG^ 3300 

TTAATATTGT TGCTTGTGAG AATGCTATTA TGGCAACTGA TACATTGAAA AAAGCAGTAC 3360 

TTGATATTAC TGGCCCTCTT GGTAACnaTA TTCATTTTGC TAACTCAGCA GTTGATAGAA 3420 

TTGTACCATT ACAAAAGAAT GAAAATATAT TAGACGTTAT GGTTGAGCCA TTTTACGAAT 3480 

GGGTTGTTGA AAAAGATGCA TGGTATGGTC CAGAACTAAA CCATATTAAA TATGTTGATG 3540 

ATTTAACACC ATATATTGAG CGTAAATTAT TAACTGTGAA TACAGGACAT GCATATTTAG 3600 

CGTATgCTGG CAAATTTGCA GOTAAAGCTA CAGTTTTAGA TGCAGTTGAA GATAGTTCAA 3660 

TTGAAGCTGG CTTACGCCGT GTTTTAGCTG AAACTAGTCA ATATATTACT AATGAATTTG 3720 

ATTTTACTGA AGCGGAACAA GCTGGTTATG TTGAAAAAAT AATAGATCGT TTCAACAATT 37 80 

CTTATTTATC TGATGAAGTA ACACGTGTCG GACGAGGTAC ATTACGTAAA ATTGGCCCTA 3840 

40 AAGATAGAAT TATAAAACCA TTAACATATC TTTATAATAA AGATTTAGAA CGCACTGGTT 3900 

TATTAAATAC AGCTGCATTG TTATTGAAGT ATGATGATAC AGCAGACCAA GAAACTGTTG 3 960 

AGAAAAATAA TTACATTAAA GAACACGGTT TAAAAGCGTT TTTAAGTGAA TATGCTAAAG 4020 

TTGACGATGG CTTAGCCGAT GAAATAATTG AAGCGTACAA TTCACTTTCA TAATTTATTG 4080 

AGCTTTGTTT GAAACAAGAA GTTTCCAACG TTATTCGTTA ACAATCAGTA ATAATGTAGT 4140 

AGTTCCCTTG AATTAACAAT ATTAAATTTC TGAACATAAA AAATACTCCC TTCAACATAG 4200 

ACACTTAACT TGTGTTATGT ATGAAAGGAG TATTTTTGCG TTAATAATTT GTTTTATTTT 4260 

CGAGCCACAG CCACCTATTC AATGGCTATT GGTCATTACT AAAACAAATT CATATTAACT 4320 
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TTGAATAAAT TTTATTCTTC AGTTTGTTGG TCTTTCTTAG TGAATCTTCT AATTAAGAAT 4440 

GCCATACCTG CACCTAGAGC TAATTCAGCA TATGGTAAAT CGTCATTATG TGACATACCA 4500 

GTATCTGGTA AAGTTTTAGC TTGTTGTTTA GCTTTATTAA CTTTTCCTTG TTGAGCTGAT 4560 

TTTGTCTTAG CTTGGTGGTC GTCAGTGTTA GTTACATTAA GCATATCTTG ATTAGCACTA 4620 

TTGCTTCCAT TTGAAACTGT AGCTGGAGAT GCATTGGCAC CGTCGTTTTG CGTAgyTTTA 4680 

TTGTTTGCAG CTGAACCAAC TGATTTTTGC GTATCATTAG TATCTGCTGT TGCCGTATCA 4740 

TCTTTTTGGC TAACATTAGT TGAAGTCATT TTTTCTTTTG CTTCAGAAGA TGCAGATGTT 4800 

GATGGTTTAT TCGAAACTTC AGTATCAGCT TTGCTTGGCG ATTTATCTGC TTCGTTAGAT 4 860 

GCAACGTTAG TTTCAGACTT AAGTTGTCCT GCATCAGTTT GATTTGTCGT ACTTTCTTCT 4920 

TTATCTTTTG ATGTATTAGA AGGTACATTT GGTTCTGTTA TGTCTGCTGA AGGCAATGTT 4980 

20 TCAGTTGTtG ATTCAACCAT ACTTTGATTT GTTGAATCAC TACCATCTTT TTCTGCCTTA 5040 

GCTTTATTTT CAGATTTTGG TTGTGCAACC TTGTCATTAG TTGATTGAGA TTCAGCACTA 5100 

TTATTTACTT CAGCATTTTG TTTTGAATCA TTTACAGATG CATTATCTTT GCTATCAGCA 5160 

GATGATGCTG CTTCTGTGCT CGCAGTTGTT GGAGCCGTTG CTGTTGATCC TGTTGGTGCA 5220 

TTCTCGTTTG TTGCTGTAGT TGTACTATTG TTATTTGTTG TGCTTTCTGC TGGCGTTGCA 5280 

TTATCAGTTT CTGTTACAGG TTTATCAGTT GTGCCGTTAT TAGTTGATTC TACTTCTGGT 5340 

TTACTAGTTA CATCGTTATC CATTGTCGGA CTGTTTGTTG ATGCATCTAC ACTAGAATTG 5400 

TTATTAGCTT GCGGTTTATC ATTTGCATCA TCAGTTGCTG ATGTTGCTGT TGTTTCACCT 5460 

GTTGCCGCAT CACTATTATT TGGTGTTGTC GGAGAAGCGT CTGCTTTGCC ATTAGCTGTC 5520 

GTCTCAGATA CGTTAGGTTG TCCAGTATTT TCTGGTGTTG CATTAGCATT TGAATTTGCT 5580 

GTTGCATCAT TATTATCTAT ACCATTATTA GTATCATTAG CATCTGGATC ATTCTGAGGC 5640 

4Q ACAATCGCTT CAATTGCAGG TATCGTTACA TTTTGTAATT CAGCAACTTC TGCATTTGTT 5700 

TGTGTTTTAT CTAATTTATC AGCAAATCTG TCAAAATATC TACCTAAATC CGTACGTGCA 5760 

ATTTCTTTCG CCGATGCATC TGCATCTGCA TTTTTAATTA TTTCTATTTG CTTGTTAACC 5820 

ACTTCTCTGA TTGCTTCCAA AGCATTTTTC TTAACTTCAG GATTAATACG TTGTGCTTTA 5880 

AGTTGTTCAA GCGCACTATT TTTGACAGTA GCGATTTCTG CATTTGTAGT TTGATCAGAA 5940 

ATATCTTCAG TTGCTTTTGA TAAAATGTCT TCTAAAGCAT TCGTAAACGC TTCTTTTTCT 6000 

50 

TCAGTTGTAG CATCAGCGTT GACATTTACA CCTGCTTCAA TCTGGTCTAG TGCAGTTTCT 6060 
(2) INFORMATION FOR SEQ ID NO: 535: 
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(A) LENGTH: 977 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNES S : double 
<D) TOPOLOGY: linear 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 53 5: 
AACAAAGCCT TCCAATTATC TGCGTCGGTA GAACAAGTAT TAGCAACTTT ATCACCTACG 
CTAAACAGTC CTTACGATTT ATACGGCACG ACAAAAATGC TAGATATTAC ATTCGATTCA 
TTTGAACATG ATGGTACAAC GTACCCTGTC GACTATGCTA CGTTTGAAAA TGATTATGAA 
GATAATAAAG ATCCTGAGTT TAGACGTAAA AGTTTCAAAT CGTTTAGCGA TGGGATTCGA 
AAATATCAGC ATACTACCGC GGCTACATAT AATATGCAAG TACAACAAGA AAAAATTGAA 
GCTGATTTAC GTGGATTTGA ATCAGTCATC GATTATTTAT TACATAGTCA AGAAGTAACG 
CGTGATATGT TTGACCGTCA AATCGATATG ATTATGCGTG ACTTGGCACC AGTTATGCAG 
AAATATGCTA AACTTTTACA ACGTATTCAC GGATTAGATA ACATGCGTTT TGAAGACTTG 
AAGATTTCTG TAGACCCTGA TTATGAACCA GAGATTTCAA TTGAAGACTC AAAAAATTAT 
ATTTTCGGTG CGTTAAGTGT TTTAGGTGAT GACTATACAA ACATGTTACG TGAAGCATAC 
GATCAGCGAT GGaTTGATTT TGCACAAAAT AAAGGTAAAG ATACAGGCGC ATTTTGTGCA 
AGTCGATACT TTACACATTC ATATGTGTTT ATTTCTTGGA CTGGTAAAAT GGCTGAAGCA 
TTTGTCTTAG CACATGAATT AGGTCATGCA GGTCATTTTA CATTAGCTCA AAAACATCAA 
CCATATCTTG AATCAGAAGC ATCAATGTAC TTTGTTGAAG CCCCTTCTAC AATGAATGAA 
ATGTTGATGG CCAATTATTT ATTTAACACA AGTGATAATC CAAGATTTAA GCGTtGGGTT 
ATTGGCTCAA TTTTATCTAG AACATATTAT CATAATATGG tACCCmTTTA TTAGAAGCnG 
CTTATCCACG GGGAGTG 

(2) INFORMATION FOR SEQ ID NO: 536: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1440 base pairs 

(B) TYPE: nucleic acid 
<C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 536: 
AGACAGTGAT yGaATTTCAT TTACAGTACA CAAATCATCG AAAAATTGGT AACATTCTTC 
TCTATTTTCT AACGTTAgwA TTgCATCAAA CAATTCATCT AACGCTGCAC CTCGTAATTT 



1470 



EP0 786 519 A2 



10 



.15 



AATCTATTAA AGTGTAGCGa TTTATATTTT ATTAAATCTG AATCGTTACT TTATTTAATT 240 

TTATGCTAAT CCAGCGCGTT CGAAAATAGT GTCAACTTGa TTCAAATGAT GTTTAGGATC 300 

GAAACATTCA TCCAATTCTT CTTTTGTTAA AACACTTGTA ATAGACTCAT CTTGTTCGAT 360 

XAATTCACX3G AACGGTGTTT TCGTTTCCCA AGATATCATC GCTTTTGGTT GTACTTTGTC 420 

GTATGCTTCT TCACGAACCA TACCTTTATT AATTAATGCT AATAAGACAC GTTGTGAGAA 480 

AATCAGACCA AATGTTTTAT CTATGTTATT ACGCATATTA TCTTCAAATA CAGTTAAACG 540 

GTCCACAATA TTTGTGAACG ATTCAATGCA TAATCTAGTG CtATTGTAAC ATCTGGTAAC 600 

ATAATACGCT CAGCAGAAGA ATGAGAAATA TsTCTTTCAT GCCATAATGG CACATTCTCA 660 

TAAGCTGTAG TAATATAACC ACGAATGACT CTTGAAATAC CTGTGATATT TTCAGAACCA 720 

ATTGGATTTC GTTTATGAGG CATTGCAGAT GAACCTTTTT GGCCTTTTGC AAATGCTTCT 780 

20 TCAACTTCTC TCGTTTCGGT TTTTTGAAGG TTACGTATTT CAACGGCAAA TTTTTCTAGT 840 

GATGTCGCGA TTAATGCTAA TGTCGCAATA TAGTATGCAT GTCGATCGCG TTGCAATGTT 900 

TGCGTTGATA CAGGCGCTGT GCCAATACCT AAATGTTTAC ACACATAACT TTCTATTTCA 960 

GGAGGAATGT TAGCAAAAGT ACCTACTGCA CCACTCATTT TCCCTACTTC AATTTCTTCT 1020 

CTTACTTGTT TGAAACGTTG TAAGTTACGT TGCATTTCCG TGTACCACAA TGCCATTTTG 1080 

ACACCAAATG TAGTTGGTTC TGCATGCACT CCATGTGTAC GTCCCATCAT CAATGTATAT 1140 

TTATAATTTT TTGCTTTTTC AGCTAAAACG TCGATAAATC TTTCTAAATC TTTTTCAATA 1200 

ATGTCATTTG CTTGTTTAAT AACGAAACTT AAAGCTGTAT CTACAACATC AGTAGAAGTT 1260 

AAACCATAAT GTACcACTTA CGTTCTTCAC CTAGCGTTTC AGAAACTTGT CTAGTAAAGG 1320 

CTACAACATC ATGGCGCGTT TCTTGTTCAA TTTCTTGTGC ACGTTCGACA TTTACCTTTG 1330 

CGTTTTGACG AATTTTTTGT ACGTCAGCTT TCGGTATATG TCCTAATTCA CTCCATGCTT 1440 
(2) INFORMATION FOR SEQ ID NO: 537: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 784 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNSSS : double 
{D) TOPOLOGY: linear 
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(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 537: 
GATAAATCTA TnCAGTTTCC GTCCAAATAT CtGCaCCTAA AGCTTTTAaG TGTTCTACAA 60 
TATCTgTATA ACCTCTATAA ATATGTTTAA CATTGTAAAT TGTAGTTACA CCCTCAGCAA 120 
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CATGTAATGT TGATGGTTTT ATCGTTGCTG TGCCTTCGTC AACTTCAATA TTTGCACCCA 
TGCGCTTTAA TTCTTCAACA TGTTTAAAAC GCTCCGGATA AATCGTATCA GTTACAAATG 

5 

AAGGACCATT TGCCATAAAT AATAATGGTG TAATAGGCTG TTGCAAATCA GTAGCAAAAC 
CTGGATATAC TAGTGTTTTA ATATCAACAA ATTGATATGG CGCATTATTA TTGATGCGAA 
TTCTTTCGTC TCTTACATCA ACATTCACAC CTAATTCACT AAATTTAGCA GTTAATGTTT 

10 

CTACATGTTT CGGAACAATA TTATTTAATA TAACATTTTC TCCACATGCT GCAGCGATAC 
ACATATATGT GCCTGCTTCA ATTCTATCAG GTATAACTTG ATACTCAGAA CCATGTAATT 

,5 CTTTGACGCC ATTGATTTTA ATTGTTGATG TACCCGCTCC CTTAATATTA GCTCCCATAC 
TTGTTAAGAA GTTAGCAACA TCAACTACTT CCGGTTCTTT AGCAGCATTT TCAATTACAG 
TTTGTCCTGT TGCATAAACT GCAGCTAGCA TAATGtnAAT TGTTGGACCT ACGCnAACCA 

20 TATC 

(2) INFORMATION FOR SEQ ID NO: 538 : 
(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3733 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



30 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 538: 

CAATCTCCAC CAATGACACG TCGTCATTCG TGACCTCATA CCArACAAAA AACAGTCTCG 60 

CAATCAAGAC TGTTTTCCAC TCAATATATT CATCCATTAG CGTAATAGAT TATTTGACTT 120 

35 

CTGTAGCTAC AAAGaTTTTA CGTTTTTCCC AAACGCCTGT cTTTTCATTG TAATCATCAC 180 

AAGTAATTAA TGTTAATTGT TTATCTTTAC CTTTTTGTTC ATCTAGAAcT CCTACATCTG 240 

4Q TAGGCTTAAC ATCTCTTATA CTTGTCATTT TATACTTACG TGTTTCATTA CCAACTTTAA 300 

AGTACACCAT ACTACCTTTT TTGGCTGCTT TAAGATTTGT AAATTGATAG TTCGGACGGT 360 

CAATGAAAGT GTGTCCTGCA ATTGAAATAT TTTGATCATC TAGTGATTCA TTTTCTTCTG 420 

CAAAGCTTAC ACCTCTATTT AATTGTTCAG GTGTTGCTGG TCCTGGATAT ACTGGTTCTT 480 

TAATATCAGC ATCTGGAATT TCAATATAGC CTGCCACTTT CGATTTATCT TTCGGAATTT 540 

GAGGTTTAGC TTGCTGCTTT TTATCTTTAC TCGCCTGTTC TTTTACATTT TTATCATATT 600 

SO 

GTTCAATCTT TTCATCTTTA TCTTTATCGT GAAGATAATT ATCGATATGT GGTTTAGCAA 660 

ACAAATATGC TGCCACTAGG aTAAGTACCA CACCAGCGAT TGTCATTAAT CGATTTGTCC 720 
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AGTATACCAT TAATTTCAAA ATGACTCATA GCAATTCATT TTATACTATA AAATTTACAT 840 

GTATACTTTT ACGTTAGATT TCATTACACA TATTTGCATT CAAATAACGA AACGCTTTTA 900 

^ ATAATTACTA AGGGGGAATT GATATGATTA GATACGCTAA AAAAGAGGAT TTAAACGCTA 960 

TATTAGCGAT ATACAATGAT GCCATTATCA ATACTACAGC TGTTTATACT TATGAACCAC 1020 

AAACCATAGA CGAACGTGTC GCATGGTTTG AAACGAAACA ACGTAAGCAT GAGCCTATCT 1080 

10 

TTGTATTTGA GGAAAATGGA AGTGTCTTAG GGTTTGCGAC GTTCGGTTCA TTTAGACCTT 1140 

GGCCAGCATA CCTATATACA ATCGAACATT CTATTTATGT CGATGCTTCA GCTAGAGGAA 1200 

AAGGTATTGC TAGTCAATTA CTACACCATT TAATTGTGGA AGCAAAAGCT AAAGGTTATC 1260 

15 

GTGCGCTAGT TGCAGGCATT GATGCTTCCA ACAAAGCGAG TATTCAGTTG CATCAAAAGT 1320 

TTGCTTTTAA GCATGCCGGC ACACTGACCA ATGTAGGTTT TAAATTTAAT AGATGGTTAG 1380 

20 ATTTAGCATT TTACGAATTA GATTTACAAG ACTAGTAATG TTTGAATCAC ATAATATAAA 1440 

CAAGACAACC ATGTTAATTC CCTTAACATA ACAAGCCAAC ATATAAAATT TTAAACTTCT 1500 

CAGGGGAGTG GGACAGAAAT GATAAAGAGC CACTAATGAT TTATTATGTA GTGGTTCTTA 1560 

CACATTAGCC ACAGCTAATG TGTAcTTAAA AATAGGAATA CATGAGTAAA ACTCATGCAT 162 0 

AAGAAATACT AATTTCTATA GAAAAAGTAT TTCTTTATCG TCGTCCCACC CCAACTCGCA 1680 

CATTATTGTA AGCXGACTTT TCGTCAgCTT CTGTGTTGGG GCCCAAAAAG CTTGTTACAA 1740 

30 

GCGCATTTTC GTTCAGTCAA CTACTGCCAA TATAACTTTG TAGAGCATAT TACATTGATT 1800 

TACATTGTCC CTTTTATTTA TTCTTTTCAA ATACTATCCC CATAGCTTTG ATTTAACGCT 1860 

TTTTCTCAAT AACAAAACGA ATATAGTAGA ACATGAAAAC GATAATCATG CTGAGCGATA 1920 

35 

AAGATTTAAA TAATAGATTG ACCCACGTTC CCTCAGTCGT ATATCCATAT GTAATCGTTG 1980 

TGTTAATGAT GAATGCTATA AAGATGATTG ATAGTCTTAG CATATCATCA CTCCTTTTAA 2040 

GTTATTTTAG ATATACGGGG GCGCTTTTGC AATCACTATT TTGATTAGTA TGCATTTTCC 2100 

ATAAATCTTT CAACTTCTTC AGAGATAATT AAGAAGCATC TATCTGGTAC TAATGATCCA 2160 

GACAGATGCT TCTTTTTTAT CAATATTTTA TTGTTATCTC ATTAATTATT TTTAACCATA 2220 

45 TCTTCAGCTG TGCCAAAGAT TTTACGTTTA ATTGCTTCGC CAGTTGGTGT GCCTGCTAGT 2280 

CCACCCAATC CAGTTTCACG TAATGATGCA GGAAGGTTAC GACCAACCTT ATCCATTGCT 2340 

TCAATAACTT CATCAACAGG GATTCTACTT TCAATACCTG CTAATGCTAA ATCTGCTGAA 24 00 

SO 

ATTAAAGCGT TACCCGAACC AATTGCATTT CTCATAACAC AAGGAATTTC AACAAGTCCG 2460 

GCTACrGGAT CACAAACTAA ACCTAATAAA TTACTTATCG CTAATGCCAT AGCGTGCCCG 2520 
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GAACCAACTT 


CAGnTTGGCA 


GCCACCTGTT 


GCACCAGCTA 


CACTTGCATT 


GTTTGCTACG 


ACACGCCCAA 


ACAATGCTGA 


AGTGAATAAG 


AAATCAATCA TTTGCTCTTC 


TGTTAAATCA 


TGTGTTmT 


CTAATTTAAA 


AAGTGCACCG 


GGAATGGTAC 


CCGAGGAACC AGCTGTTGGC 


GTCGCACAAA 


TAATACCCAT 


CGCAGCATTG 


ACTTCATTTG 


TTGCAATGGC 


AcCtTTGcTG 


CGTCAATCAT 


TTCATATCCA 


GACAAAGCAT 


GATGTGTTTC 


ATTATAATCA 


CGTAGTTTAG 


CAGCATCATG 


ACCAGTGTAG 


CCCGTTACAC 


TTTCAACCCC ATCACCTGTC 


GTCCCTTTGA 


TTACTGCGTC 


TCGCATGACA 


TCTAAATTTT 


GTTTCATTTG 


CGCTCGCACT 


TCATCACGTG 


ATTTACCGCT 


TAATTCCATT 


TCTTCTTTAA 


CCATGATATC 


CGCAAATGAC 


ATATTATTTT 


CTACGGCATA 


ATCTATAGTC 


TCTCTAATTG 


AATCAAACAT 


GTTTATTCCC 


CCTCTAATTT 


ATATAGGAAA 


CGTTTACGTC 


ACTGTATTTC 


TCTTTAATTG 


TATTTAATGT 


TGATTCTGAG 


ATTGCTTTAT 


TTAATGGTAT 


TACAACCAAG 


CATTTATCTT 


CATCTATCTT 


AATAAATTCA 


TCTTTACAGT 


CTAATTTCAT 


ATCGTTGATA 


TCATTGATGA 


AATGATTTAC 


TTGTGCTTTA 


GTCATATTTC 


CGTCAACAAC 


TAAAATTGGT 


AATCCATGAT 


TTAAATCTAC 


TTCTAGTCCA 


TTTATATGAA 


TACCTTTAAT 


TTTAATTGTA 


CCACCACCGA 


TTGAAATACC 


GATAATTTCA 


ATGTAGCGAC 


CATCATTACG 


AGATGATTTG 


ATATAAGCAC 


AGTTTGGATG 


TTGACCAATA 






C S.T" AT*/ "I* IV' I"!' 
viAJLAl AAA i 


TTAATACCAT 


CATCAGCTGC 


AATTTCTAAT 


GAAGATTTAA 


TTCGGTTATC 


AAATGTTGAA 


TATCCCATTG 


CTCCACCCAC 


AATAGCGACA 


TCTGTACCAT 


GTCCTTGGTG 


TGTTTGAGCA 


AATGATTCAT 


AATAATGTAT 


TTCAATATTT 


TTATATCTCC 


CAATATTGCG 


CGTGCTGAAT 


TCCCCTTTAC 


TGCACCAGCC 


GTATGAGAAC 


TTGAAGGGCC 


CAT 











(2) INFORMATION FOR SEQ ID NO: 539: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 525 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SSQ ID NO: 539: 
TGGCTGTCTT CTCTATGAGT GTAGTAAGTA AGTTAACGGA TTTAACGCCA AGGCAAATAC 
GTTACTATGA AACACATGAA CTCATCAAAC CTGAAAGAAC AGAAGGTCAA AAACGTCTGT 
TCTCACTCAA TGATTTGGAA AGATTACTAG AAATTAAATC ATTATTAGAA AAAGGATTTA 



2640 
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2760 
2820 
2880 
2940 
3000 
3060 
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T^GAGATAAG AAAAAAGATG ATTGTAGATG CCACGCAAAA GCCTATTGGA GArACTTTGC 

CAATAAATCG TGGTGATTTA TCCCGATTTA TTAAATAAAA TTTGGAGGAT TTTAAAATGC 

CAAAACGTAC TTTCACTAAA GACGACATTC GTAAATTTGC AGAaGAGGAA AaTGTAaGaT 

ATTTAAGATT ACAATTCACT GATATTTTAG GAACAATTAA AAATGTTGAA GTGCCTGTAA 

GCCAATTAGA AAAAGTACTT GATAACGAAA TGATGTTTGA CGGTA 

(2) INFORMATION FOR SEQ ID NO: 540: 

(i> SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 14 08 base pairs 
(3) TYPE: nucleic acid 
(C) STRANDEDNESS : double 
(0) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 540: 
TTGATTTGCT ACAAAGTATC TnCTCATTTC TGTATCCTGA AAAATCTTTA GTGTAATAAT 
GTTGTTCAGT TTTAATATTT TCAGTCATAG TTGACTACCT CCGTATATTT TGATTTAATT 
AAGTTGTATA TTTTGATGAA CACTTATTGT TACTTGTTGG CGCAAGTAGC AGTTTTTTCA 
TTCTTCATAA AAGTATTCCT TATAGAATAT GAATGTTGCG ATACTTGCGA ATCCTGCAAT 
TGaCCATGCT GtAGTGAAGT ATAGAAACGG CATAAGTACA ATCGCTAAGA CTGTGAAGCA 
TAGTACTGCT ACTAGGTAGC TTTTATAAAT GTTACTCATT TTCTTTTTTC AACTCCTCCA 
TTATTCTCTG GTCTGATAAG TCGTGATAAG GGAATTTTTT CCtAGCTAAT TGGACTGGTA 
TTCTGCCTCG TATCGCAATG TATCCTTCAT CTTCAAGCTC TTTATTCAGT TCTCTTATTA 
TTTGTCCTGC TTTGGATTTA GAAACAGATA AAATTACCgC AAGTTCTTTA GCTTGCAAAC 
TATTTTTCAT CATATCTTTT CCTCCTTTAA AATAACTGTT GATTCTCTGG GTTATCTGCT 
TCGTAATTAT CTGCAATAAT ACTTTTAGCG AAAAAGTCCA AACTGACCTT ATATAGGTTG 
TTCATAGATT TCTTTACGTT AACCCCTTCC TCAAGTACAT AAGOCACCCT AAAATCATTT 
ATAAACAGTC CGTTTTCGTC TAAAGTAACG GTTGGTAATT CAGGTTTGTT CCGTCTATAA 
ACTTCTCCTA GTGTAGGTTT TTGCTTTTCA GCTTGTTTAG TGAAGTCGGA AAATGCCTTA 
AGTAGTTTTA TTCCTGAATC AGGATCACTG TGTCGCTCAA TCGTTTCTGC TGTAGACTCT 
TTACTAAAAT CATTTCTATT GATTACAGGC TTTCTCGTAT TTCGTTCAAT CTTCCAAACC 
TTCCACGTCA CAACTGCCAT TGTGGTGAGG AGGGTTGTTT TGTATAGTGC GTTCATTTGT 
AATTCCTCCT ATTAAGTTGT TTGTTCAATT GTGTGTGTTA TTCTTCTTCG TCTAAATCAA 
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CGACTTCGTA AGTGTGCTCA ATCTCGCCTG cATATGTCAC AGTAAGAGTA TCTTTGTGTG 1200 

TGTATGTTTG ACTTTTGTTy TCTtTAACTG CATAAAGTGT TAATACTATA TTGTTTAGCT 1260 

TTyCTTTTTG TTCTGGTGTC ATTTACGCTC CCCCTAmATT AGCyTCATAA CCGAATTCAG 1320 

TCATGATTTC ATGTATTTTC AATCTGCCTT TTTGTGTCCA TCTAGTTTGT AAAACTGTGT 1380 

CTTCTCTGCC ATCAGAACGC ACAATTGT 1408 
(2) INFORMATION FOR SEQ ID NO: 541: 
(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 432 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



20 (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 541: 

GTTCGTCAAT GATTTTTATC CGA7GCTATG AGCATTaTCA AATACAAAAT GCTCTCTTAA 60 

AAGCAGTTAT TGACTGAAAA TCTACTTCTA AGAGAGCACT TTATTTAATT ACTTAAGAAA 120 

25 TCTTGAAATT TCAATATACG ATGTTTATGA TAAGTCGCTT ATTTCATCTT TAGGCTTGTT ISO 

ATTAGTAAGT AGTTTAATAC CACTGATTAA CCATAAAGCA AATGTAATTA TGTTACCACT 24 0 

TATTACAGCT CCAATAATCA ACAATATACC ACTCATTTTT TTGTTTTTAG ATGCTTTAAA 300 

30 

CATACCGATT GCACCTAAAA TAATTGAAAT GATTCCAAAT ATQAATAGQG ATAAGAATAA 360 

TACAGTGAAA ATTGCTGCTG CTGTTTCTGc ATCAACTGGG nCAACCTCAC CATTAACTGT 420 

TGTTGGACAC AT 432 

35 

(2) INFORMATION FOR SEQ ID NO: 542: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2426 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 542: 

ATAATCATGA AGTnGCTAAA nCGCCAAATA ATGATGGTTC TGGACATGTT GTGTTAAATA 60 

AATTCCTTTC AAATGAAGAG AATCAAAGCC ATAGTAATCG ACTCACTGAT AAATTACArG 120 

GAAGCGATAA AATTAATCAT GCTATGATTG AAAAATTAGC TAAAAGTAAT GCCTCAACGC 180 

AACATTACAC ATATCATAAA CTGAATACGT TACAATCTTT AGATCAACGT ATTGCAAATA 240 
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GAGGAACATT TGAACATAAA ATAATATATT TATATAAAAC GACCgAGGCG TTCGAACTGA 2160 

ATGtCCTCGG GTTTAATTGA ATAGAAATCG GACTTATGAA CGAAATATGT TTAAGTCGAA 2220 

CTCCTTGTTT ATACTTATAA ATTTTACGGG TTTAATATAA TACTTATTTA CCTGTAATAT 2280 

ATGCATAATT nCTTCAGTCG GTCAGCCTGT CGTTGCATAG TTCCTATGCA GCAAATGCAT 2340 

ATCCTAATCC TTTAACATTG GCATTnCTGC AAATGAACGC ATAGAATCCA TTCACTGTTA 2400 

ACTTTTTnCA ACAAATGTCT nACATG 2426 
(2) INFORMATION FOR SEQ ID NO: 543: 

(i> SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1874 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY; linear 

20 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 543: 

GAGTTGGGGA ATGTGCTCAA AATATGCGGA CTTTATGCAT TyCGGAATTG sCCaATTGCA 60 

25 GCTTTAAGCT ATGGTCAAAA AAAGAGGGTC ACTATAGCAT CTGTTTTAGT CTTAAATCCG 120 

GAAATAATCA TATTGGATGA ACCGACTGCT GGTCAAGATT TCTATCATTA TAATGAGATA 180 

ATGTCATTTT TAATTGAACT AAACAGACAG GGGAAGACGA TTATTATGAT TACGCATGAT 240 

ATGCATTTAT TGTCTGAGTA TAGTTCAAGA ACAGTTGTAT TATCAAAAGG TCAAGTCGTT 300 

GCTGATACCA CGCCAgTATT GG7TTTAAAT GATAAAAAAA TCTGTGAGAT TGGATCATTG 360 

AGACAAACAT CGCTATTTGA AATGGCCGAA TATATAGGGA TTAGCGAGCC ACAGAAATTA 420 

GTACAATTAT TTATTAACCA TGATAGGAAG GTGAGACGcC AATGAATCAA TATAATACTA 480 

TAGGTTTTCA CCCGGGAAAT AGTCGTATTC ATCAATTAAA TGCGACTGTT AAACTTTTAT 540 

TCTTATTAGT TGTTTCTATT TCTGCAATGG TGACTTATGA CACAAGATAT TTAATTTTAA 600 

TTAGTGCTTC ATCTATTTTA TTGGTCAAAT ATGCTCATAT TGAATGGAAA CAAGTTCGCT 660 

TTGTTGTTAA ATTCATTCTG TTTTTCACAA TAtTAAATAT TATTGCCGTG TACATATTTG 720 

45 ACCCTGAATA TGGTGTGAAG ATTTATAATC AGCGTACAGA GTTAGTCAAT GGTATTGGTC 780 

GATTTACGCT AACATCACAG GAATTATTCT ATCTTTTTAA TCTAATATTA AAATATATTA 840 

- GTACAGTTCC TTTAGCGTTA ATATTTTTAT TCACAACGAA TCCGAGTCAT TTTGCTGCAA 900 

GTTTAAATCA GCTAGGTGTG AATTATAAAA TCAGTTACGC AGTCTCACTA GCATTAAGGT 960 

ATATTCCAGA TATTCAAGAA ACATATTttA ATATTTCACA AGCGCAACAA GCAAGAGGAT 1020 
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TACCTTTAAT ATTTTCTAGT ATCGAAAGAA TTGACACTAT TAGTACTGCT ATGGAGTTAA 
GACAATTCGG ACAGTATAAA AGGAGAACCT GGTACGTCAA AAAACAATTA AAAAAAGATG 
ATTATGTTGT TTTGTGTTTG ACGTTAATAC TTCTGATGTT AGTAGTTACA TTATTCTTTT 
TAAATAATAG TCGATATTTC AACCCGTGGC ATTAGTATTC ATATAAATAG TCTTTAAATA 



jAAATAGGAG GGAGACATTT AATGATAAAT ACTGAAAGAT TAAATTTAAT GATTCCAAGT 
XCTCGCATT TAATTGAACT TTATAATATT TGTAGTCATC CACAAGCAAA TATATACACT 

:ccaaaggtt tacataattc caaattagac acacaacggt ggattgaaaa atggcgaaac 

lATTGGCAAC AATATCAATT TGGTTACTTT GTATTGGTAA AAAAAATAGA TTGTAGTGTT 
ITTGGTATTT GTGGATATGA ATATCGACAA TTAAAGCAAG AaACAGTATT AAATTTATTT 
rATAAATTAC ATCCAAGTTT TGAAGGACAA GGGTACGCAT GTGAGGCTAT TACAGCAATC 
ICAAArrXTG TGAA7TATAT CGATCAAGAA ACAGTAAAAG TTATCAGGAC AAATAAGTGT 
^CCAACGTT CAATAAATTT AGCAGAAAGG CTTAAATTCA AGCGAGACGA TACTATGGAC 
JACATTATCA ATCAAGGAGA TATTGTGTTT TAAnAATAAA ATACTATGAC ATTATCTAAA 
LAATAAAATT AAAA 

.2) INFORMATION FOR SEQ ID NO: 544: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 5280 base pairs 

(B) TYPE: nucleic acid 

(C) STPANDEDNESS : double 

(D) TOPOLOGY: linear 



1380 
1440 

1500 
1560 
1620 
1680 
1740 
1300 
1860 
1874 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 544: 



1140 
1200 
1260 
1320 



10 



15 



20 



25 



30 



35 



I 
G 

< 



.'CAACATTTC 


TAACACCAAT 


GTGAAAATGA 


TCTATGTGAT 


TTGCAATGGC 


TTGATTTGTA 


60 




1 


tTATGTGTGC 


CTAAATGACC 


TGTAGCACCT 


GTTAACATAA 


TATTCATTCA 


CTTCATCTCC 


120 


40 


P. 


'AATCTTTAT 


ATACATAACA 


TAATACTTAT 


TTGATGGTTT 


TCAAAACATT 


TGATTTTATA 


180 




1 


AAAATTCTA 


ATCTGTATTT 


ATTGTCGACG 


TGTATAGTAA 


ATACGTAAAT 


ATTATTAATG 


240 


45 




TGAAAATGC 


CGTAATGACG 


CGTTTTAGTT 


GATGTGTATC 


ACTAATATCA 


TTGAAAATTT 


300 


T 


'AATCaGGTA 


CTACGACAAT 


ATGATGTCTG 


TTTTGTGTCT 


GAAAGTTTTA 


CAGTTTTTAA 


360 




T 


ATAAAAATG 


GTATAAAGTG 


TGATTTGTAT 


AAAAAAGAGT 


CTCGACGGAT 


AAGAATTGAT 


420 


SO 




'AATAACAGT 


TAGCATTTTA 


TTAATTACCT 


TAACAATGAT 


TCAAGTTTAG 


TTAAATGAGG 


480 




T 


TTAATTTGA 


AAGGGGATAG 


CGCCTCAATA 


TAATGTAGGT 


AGATTGTTCA 


TATTACGTAA 


540 




T 
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AAGCAAGTTT AGCATTGGGA ATGTTAGCAA CAGGTGTAAT TACaTCGAAT GTACAATCAG 660 

TACAAGCGAA aGCAGrAGTT AAaCAACAAa GTGAaTCAGA GTTAAAACAC TATTATAATA 720 

AmCCAATTTT AGAGCGTAAA AATGTGACTG GATTTAAATA TACTGATGAG GGTAAACACT 780 

ATTTAGAAGT CACAGTAGGG CAACAGCATT CTCGAATCAC TTTACTTGGA TCTGATAAAG 840 

ATAAATTTAA AGACGGAGAA AACTCAAATA TAGATGTGTT TATCCTTAGA GAAGGTGACA 900 

GTAGACAAGC AACAAATTAC TCAATTGGTG GCGTTACAAA ATCAAATAGT GTGCAGTATA 960 

TTGATTATAT CAATACGCCA ATTTTAGAAA TCAAGAAAGA TAATGAAGAT GTACTTAAAG 1020 

ATTTTTACTA CATTTCAAAA GAAGACATCT CATTAAAAGA ACTTGATTAT AGATTAAGAG 1080 

AACGTGCGAT TAAACAACAC GGCTTGTATT CAAATGGTCT TAAACAAGGT CAAATTACAA 1140 

TTACAATGAA TGATGGCACA ACACATACAA TCGATTTAAG TCAAAAACTT GAAAAAGAAC 1200 

20 GTATGGGTGA GTCAATCGAC GGCACTAAGA TTAATAAAAT TCTAGTAGAA ATGAAATAAT 1260 

ACTTTCTAAC AACAAAGCGC TATGTTGAAT AGTGCTTGTT ATGGAAATAT ATGGAAGTTA 1320 

AGCGACGTAC TGTTGCTTAG CTTCTTTTTT TGAGGGGAAA AGTTACAAAA CTCACACAAA 1380 

CAGTCGCACC ACGCATTATC TTTTGCTTAA ATAGCTTAAT CATATTTTAT GAATAGTTAA 1440 

AAACAGGTTA ATGTGAATAT CCGAATACAG CTCCTATAAT ATGGGTGTAT GATTCAAATT 1500 

ACGTAATAAA ACAATCTAAT TATAATAGAT TGGAGCATAC AACTATGAAA ATGAAAAATA 1560 

TTGCAAAAAT AAGTTTGTTA TTAGGAATAT TAGCAACAGG TGTAAACACT ACAACGGAAA 1620 

AACCAGTTCA TGCCGAAAAG AAACCTATTG TAATAAGTGa AAATAGCAAA AAATTAAAAG 1680 

35 CTTATTATAA TCAACCTAGT ATTGAATATA AAAATGTGAC AGGTTATATC AGTTTCATTC 1740 

AACCAAGTAT TAAATTTATG AATATCATAG ATGGTAATTC TGTTAATAAT ATTGCTTTAA 1800 

TTGGCAAAGA TAAGCAACAT TATCATACGG GTGTACATCG TAATCTTAAT ATATTTTACG 1360 

TTAATGAGGA TAAGAGATTT GAAGGTGCAA AGTACTCTAT TGGGGGTATC ACGAGTGCAA 1920 

ACGrTaAAGC TGTCGACCTA ATAGCAGAAG CAAGAGTTAT TAAAGAAGAT CATACTGGTG 1980 

AATATGATTA TGACTTTTTC CCATTTAAAA TAGATAAAGA AGCGATGTCA TTGAAAGAGA 2040 

TTGATTTTAA ATTAAGAAAA TACCTTATTG ATAATTATGG TCTTTACGGT GAAATGAGTA 2100 

CAGGAAAAAT TACAGTCAAA AAGAAATACT ATGGAAAGTA TACATTTGAA TTGGATAAAA 2160 

AGTTACAAGA AGACCGTATG TCCGATGTTA TCAATGTCAC AGATATTGAT AGAATTGAAA 2220 

TCAAAGTTAT AAAAGCATAA CACATATACT TGATGACGAA ATAAGTTGAA ATTGAAATAG 2280 

AGAGGTTAAG TGACGATCAA ACGTTGCTTA ACTTCTTTTT AATGCTTAAA AATTATTTCA 2340 
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TTAATAATAC TTCAATAATT GTTAAAAGGG 
ATAATGATGT TGTATGATTC AAATTACGTA 
^ GCATACAATT ATGAAAATGA GAACAATTGC 

AACAGGCXjCA ATTACAGTAA CGACGCAATC 
AGTtGACAAA GTACCAACGC TTAAAGCAGA 

10 

TGCAAATTCA GCGACAACAC AAGCAGCTAA 
-AAAGGCACCA AATACTAATG AGGAAAAAAC 
ACCTAAACAA GAAGAGCAGA AAACGCTTAA 

ACAATCACAA acgacaaccg aatccacaac 

AACAAACACG CCACAACCAA TGCAATCTAC 
AAAACAAGCA CAAACAGATA TGACTCCTAA 
ACCGAGTTTT GAATTTGAAA AGCAGTTTGG 
GTTTATGAAT GTTATTCCAA ATAGGTTCAT 

25 

GAAAAAATAT AAAGATGGAC CTTACGATAA 
TAAATATCAA TTGAAAAAAT ATTCTGTCGG 
TAATCACAAA GTAGAATTAA GCATTACTAA 

30 

TGTTTCAGAA TACATGATTA CTAAGGAAGA 
GAGAAAACAA CTTATTGAAA AACATAATCT 
35 TATTAAAATG AAAAACGGTG GGAAATATAC 
TCGTATGGCA GACGTCATAG ATGGCACTAA 

ATCATGACAT TCTCTAAATA GAAGCTGTCA 

40 

TTTACATGTT GCTTAGCTTC TTTTATTATG 

TGTTTGTAAA AGTGGCATTT CTATGTCTTA 

TTGAATCACA TCAAAATCAT TTTTATTTAA 

45 

CGATGATTCA AATATAGTTA AACAAGGTTT 
TAAAGCTGTA TGATTCAATG AATGTAATCG 
SO CAACTATGAA AATAACAACG ATTGCTAAAA 
GTGTAATCAC AACGACAACG CAAGCAGCAA 
AAGCACCACA ATCAACACCG CCCTCAACTA 

So 
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GTTTAATGTG ATTATCTTAG AACGCCATCT 2460 

AAAAGACAAT CGAATATAAT ATAGATTGGA 2520 

TAAAACCAGT TTAGCACTAG GGCTTTTAAC 2580 

GGTCAAAGCA GAAAAAATAC AATCAACTAA 2540 

GCGaTTAGCA ATGATAAACA TAACAGCAGG 2700 

CACAAGACAA GAACGCACGC CTAAACTCGA 2760 

CTCAGCTTCC AAAATAGAAA AAATATCACA 2820 

TATATCAGCA ACGCCAGCGC CTAAACAAGA 2880 

GCCGAAAACT AAAGTGACAA CACCTCCATC 2940 

TAAATCAGAC ACACCACAAT CTCCAACCAT 3000 

ATATGAAGAT TTAAGAGCGT ATTATACAAA 3060 

ATTTATGCTC AAACCATGGA CGACGGTTAG 3120 

CTATAAAATA GCTTTAGTTG GAAAAGATGA 3180 

TATCGATGTA TTTATCGTTT TAGAAGACAA 3240 

TGGCATC7VCG AAGACTAATA GTAAAA?\AGT 3300 

AAAAGATAAT CAAGGTATGA TTTCACGCGA 3360 

GATTTCCTTG AAAGAGCTTG ATTTTAAATT 3420 

TTACGGTAAC ATGGGTTCAG GAACAATCGT 34 80 

GTTTGAATTA CACAAAAAAC TGCAAGAGCA 3540 

TATTGATAAC ATTGAAGTGA ATATAAAATA 3600 

TCGGAAAAAC AAGAAGTTAA GTGACAACGG 3660 

CGTAATGATG TAAAAAGACG AATATTCATT 3720 

AAAGTGACGA AACTTCAAAT GTGCCAAGTG 3780 

CGAACATTAT GGATTTCTTA ATTTACTTAA 3840 

AATGTGAATG GAGCAATACG CCATCTATAA 3900 

AACAAATCTA ATAATTACGA ATGGAGCATA 3960 

CAAGTTTAGC ACTAGGCCTT TTAACAACAG 4020 

ACGCGACAAC ACTATCTTCC ACTAAAGTGG 4080 

AAATAGAAGC ACCGCAATCA AAACCAAACG 4140 
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CGCCTTCAAC TAAAGTGACA ACACCTCCAT CAACAAACAC GCCACAACCT^ ATGCAATCTA 

CTAAATCAGA CACACCACAA TCGCCAACCA CAAAACAAGT ACCAACAGAA ATAAATCCTA 

AATTTAAAGA TTTAAGAGCG TATTATACGA AACCAAGTTT AGAATTTAAA AATGAGATTG 

GTATTATTTT AAAAAAATGG ACGACAATAA GATTTATGAA TGTTGTCCCA GATTATTTCA 

TATATAAAAT TGCTTTAGTT GGTAAAGATG ATAAAAAATA TGGTGAAGGA GTACATAGGA 

ATGTCGATGT ATTTGTCGTT TTAGAAGAAA ATAATTACAA TCTGGAAAAA TATTCTGTCG 

GTGGTATCAC AAAGAGTAAT AGTAAAAAAG TTGATCACAA AGCAGGAGTA AGAATTACTA 

AGGAAGATAA TAAAGGTACA ATCTCTCATG ATGTTTCAGA ATTCAAGATT ACTAAAGAAC 

AGATTTCCTT GAAAGAACTT GATTTTAAAT TGAGAAAACA ACTTATTGAA AAAAATAATC 

TGTACGGTAA CGTTGGTTCA GGTAAAATTG TTATTAAAAT GAAAAACGGT GGAAAGTACA 

CGTTTGAATT GCACAAAAAA TTACAAGAAA ATCGCATGGC AGATGTCATA GATGGCACTA 

ATATTGATAA CATTGAAGTG AATATAAAAT AATCATGACA TTCTCTAAAT AGAAGCTGTC 

ATCGGAAAAA CAAGAAGTTA AGTGACAACG GCCTACATGT TGCTTAGCTT CTTTTGTTAT 

GTTCGATGAT TTGAGAACCC GAATTTTCGA TGGGTCCAAA TATGACGTGG AAGAGACCTG 

AATTTATCTG TAAATCCCTA TCTATCGGGT GTGAAGCACA ACGGGATCAG TTTTATTTAA 

CGAACATTAT AGATTCCTTA ATTTACTTAA TAATGATTCA ATGATTATTA AACATGGTTT 

AATGTGAAAG GTCAAATACG CTAACTATAA TAAAGCTGTA TGATTCAATA GACGTAAGCG 

AACAAATCTA ATAATTACGA ATGGAGCATA CAACTATGAA AATGACAGCA ATTGCGAAAG 

(2) INFORMATION FOR SEQ ID NO: 545: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: BBS base pairs 
(3) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 545: 
AGTAAAATTG CCGGTATGAT GGACACAAAC GGTGACCTTG GTCAAGGTGA ATTAGCGATT 
AATCCACCtA AATCAGATTT gAACGAATTA CCTTGGGCTA CACGTAAAAA TAAACAGCCA 
GCTTCATCCG AAAAAgGTTC AAGTGGTCAT CATGGTAATG CAGCAATGCC TCAAACCAmA 
TTAGATTATC AAATATCTAT TGATAAGGTC GTTGAACAGG CGCAAAAAGC TGGTATTAAA 
AAGCCGTTTT CAATCGTATA TCCAAGTGAT AAAAATGGTA CCTTTATTGT ATCTAATACT 
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10 



20 



25 



ATAACCTTGA TTTAAGATCT AAATTAAAAT TTAAATATAT GGGGGAAGTC ATAGAAAGCA 960 

AACAAATTAA AGATATTGAA GTTAACTTAA AGTAAATCAT TACGAATAAT TAAAAGTAAT 1020 

TGAAGCGGCT TAACGGTGAA ATGTAAATTG GTGCGCATAG CTTATACAAA AAGGATGCAT 1080 

CAATCGATAT CGTCGTTAAG CCGTTTTGGT TTGTGTGTCA TGAATCCTAT CCCAATCTCC 1140 

ATAAAGGTAA AATTTCCACC ACCAACATCA AAATTCTCCA CATCGCAACA TAACCAAATG 1200 

TTATAATAAA TCTATTACAC AAAGAGATAA ATTACTTATT CAAAGGCGGA GGAATCACAT 1260 

GTCTATTACT GAAAAACAAC GTCAGCAACA AGCTGAATTA CATAAAAAAT TATGGTCGAT 1320 

75 TGCGAATGAT TTAAGAGGGA ATATGGATGC GAGTGAATTC CGTAATTACA TTTTAGGCTT 1380 

GATTTTCTAT CGCTTCTTAT CTGAAAAAGC GGAACAAGAA TATGCAGATG CCTTGTCAGG 1440 

TGAAGACATC ACGTATCAAG AAGCATGGGC AGACGAAGAA TACCGTGAAG ACTTAAAAGC 1500 

AGAATTAATT GACCAAGTCG GTTACTTCAT TGAGCCAGAA GATTTATTCA GTGCGATGAT 1560 

TCGTGAAATT GAAACGCAAG ATTTCGATAT CGAACACCTG GCGACGGCAA TTCGTAAAGT 1620 

TGAAACATCA ACATTAGGTG AAGAAAGTGA AAATGACTTT ATCGGTCTGT TCAGCGATAT 1680 

GGATTTGAGT TCAACGCGAC TAGGTAACAA TGTCAAAGAA CGTACTGCTT TAATCTCTAA 1740 

AGTCATGGTT AATCTTGACG ACTTACCATT CGTTCACAGT GACATGGAAA TTGATATGTT 1800 

AGGTGATGCA TATGAATTCC TAATTGGGCG CTTTGCGGCG ACAgCGGGTA AAAAAGCAGG 1860 

CGAGTTCTAT ACACCACAAC AAGTATCTAA GATACTGGCG AAGATTGTCA CAGACGGTAA 1920 

AGATAAATTA CGTCACGTGT ATGACCCAAC ATGTGGTTCA GGTTCACTGT TGTTACGTGT 1980 

35 TGGTAAAGAA ACACAAGTGT ATCGTTATTT CGGTCAAGAA CGTAACAATA CTACATACAA 2040 

CTTAGCACGC ATGAATATGT TATTACATGA TGTGCGTTAT GAGAACTTCG ATATCCGTAA 2100 

TGATGACACA TTGGAAAACC CAGCCTTTTT AGGCAATACA TTTGATGCGG TTATTGCGAA 2160 

CCCACCGTAT AGTGCGAAAT GGACTGCAGA TTCAAAGTTT GAAAATGACG AACGATTCAG 2220 

TGGTTACGGC AAACTTGCGC CTAAGTCTAA AGCAGACTTT GCCTTTATTC AACACATGGT 2280 

ACATTACCTA GACGATGAAG GTACCATGGC CGTTGTACTC CCACATGGTG TATTATTCCG 2340 

AGGTGCTGCA GAAGGTGTCA TTCGTCGTTA TTTAATTGAA GAAAAGAACT ACTTAGAAGC 2400 

TGTGATTGGT TTGCCAGCGA ATATTTTCTA TGGGACAAGT ATTCCAACAT GTATTTTAGT 2460 

SO ATITAAAAAA TGTCGCCAAC AAGACGACAA CGTACTATTT ATCGATGCAT CCAATGATTT 2520 

TGAAAAAGGA AAAAATCAAA ATCATTTAAG CGATGCCCAA GTCGAACGTA TTATAGACAC 2580 

ATATAAGCGT AAGGAAACAA TTGATAAATA TAGCTACAGC GCGACACTAC AAGAGATTGC 2640 
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GATTGATTTA GATCAAGTCC AACAAGATTT 
TGAGCAAGAA ATCAATGCAT ACCTGAAAGA 
^ AAAAGAAAAA TGTGCCAGAA TTGAGGTTCC 
AGTTAGGGGA TCTTACAGAT AGAGTAATTA 
CTTTAACAAT ATCCGGACAG TTAGGTTTAA 

10 

TTTCGTCGAA AAATCTAGAA AATTATACAC 
AAAGTTATTC TAATGGATAC CCATTAGGGG 
j5 GTGTATTGTC CTCTTTGTAT ATTTGTTTTT 
TGGAAGCATA TTTTGATTCG ACACACTGGT 
GTGCAAGAAA TCACGGATTA TTAAATGTTT 
AATATCCAAG TTTAGAAGAA CAGCAAAAAA 
AAATTGAATT AGAAGAACAA AAGCTTGAAT 
AGAAAATTTT CTCACAGGAA CTGCGATTCA 

25 

GGGAAAATAG CAAAATAGAA AAATATTTAA 
AAATGCTTTC AGTAACTATA AATAGTGGCA 
ATAATTCAAG TAAAGATAAA AGTAATTATA 

30 

ATTCTATGAG AATGTGGCAA GGGGCTAGTG 
CTGCATATAC TGTGCTTTAT CCAACACAAA 
Jo TTAAAACACA TAGAATGATT CATAAATTTA 
CATGGAACTT AAAATATAAA CAATTAmAAA 
AACAAGAAAA GATAGGTGAT TTCTTTAAAA 

40 

TGAAAATTGA AATATTAGAA AAAGAGAAAC 
TTTGATAAAT ACATAGATTG CATAAGAATA 
AAAGTAAAGT GAATTAAAAA CGAACATTAA 

45 

TTTGTGTCGA AATTGTGTAC AGAATAAGTA 
TTATTCGTAA ATAAAAGAGA GTAGATCGAT 
TTAAATTACT TAATAATGAT TAATTTTTAG 
TTGCTCATTA TAATGA 
(2) INFORMATION FOR SEQ ID NO: 5 
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GAAAAATATC GATAAAGAAA TCGCAGAAAT 2760 

ACTTGGGGTG TTGAAAGATG AGTAATACAC 2820 

CAGGGTTTGA AGGCGAATGG GAAGAGAAGC 2880 

GGAAAAATAA AAACTTAGAA TCGAAAAAGC 2940 

TTGATCAAAC AGAATATTTT AGTAAATCAG 3000 

TAATAAAGAA TGGAGAATTC GCGTATAACA 3060 

CTATTAAAAG ATTAACTAGA TATGATAGTG 3120 

CTATTAAAAG TGAAATGTCT AAAGACTTCA 3180 

ATAGAGAAGT TTCTGGAATT GCAGTTGAGG 3240 

CTGTGAATGA TTTTTTTACT ATTCTAATTA 3300 

TAGGCAAGTT CTTCAGCAAA CTCGACCGAC 3360 

TACTTCAACA ACAGAAAAAA GGCTATATGC 3420 

AAGATGAGAA TGGTGAAGAT TATCCAGATT 34 30 

AAGAGAGAAA CGAACX5TTCT GACAAAGGGC 3540 

TTATAAAATT TAGTGAATTG GATAGAAAAG 3600 

AAGTAGTTAG GAAAAATGAT ATTGCATATA 3660 

GTAAATCAAA TTATAATGGG ATTGTTAGCC 3720 

ATACTAGCTC ATTATTTATT GGATATAAGT 3780 

AAATTAATTC ACAAGGATTA ACATCAGATA 3840 

ATATAAATAT AGATATACCT GTATTGGAGG 3900 

AAATGGATAT ATTGATAAGT AAACAGAAAA 3960 

AATCCTTTTT ACAAAAAATG TTCTTATAAC 4 020 

AAATTTGTAT AATTTAACAT AAAAGTTGTA 4080 

ATTTAGGCAC TGTGAAAGCG CAGTGTCTTT 4140 

GTTAAATAAA GATTAAGTTG AGATAAAGTG 4200 

AGGAATTGAA TGATATTAGT TAACTATTTA 4260 

TTAAAGTAAG TTTAATGTGA AGCACGACCA 4320 

4336 

17: 
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(A) LENGTH; 437 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 547: 
TAAGCTATCT GAGATAATTG CTGATAACAT TAAACCGGCA ATTTCAGGTT TAATTTCAAA 
GCCACGTTCT CTAAACATTT TGTATAAAAT TGTAGCTGTA CAACCAACTG GTTCAGCACG 
ATAACATAAA GGACCAGCAG TTTCGAAATT TGCAATTCTG TGATGATCAA TTACATGCTT 
AATTGTAGCA GAGGCAATCG TATCAGAACT TTGTTGGaAT TCGTTATGAT CAACTAAGAT 
AACATCTTGA CCATCTAAAT CATCTGTTAA TAATTCCGGA GCAGGTACAT TAAATGTATC 
TAACGCGAAT TGAGTTTCTG CACTCACATC ACCTAAACGG TATGCTTTGG CTCCTGAATT 
ACCTCGAAGT TGTTCaAATT CTGCCaTAAT AATCGCAGAT GAAATTGCAT CAGTGkCTGG 
aTTCTTATGT CCGAAAATAT ATGTTTTAGC CAnTGTCAAA TATCTCCCTT GTAAATTGTA 
TTCTTTA 

(2) INFORMATION FOR SEQ ID NO: 548: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 871 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 548: 



TTGGTGGTGC 


AGCAGTTATA 


GCAATTGTTT 


TAGCATTCAT 


TGGTAAGTTC 


ACTGCATTAA 


TTTCTTCTAT 


ACCTACmCCA 


GTTATGGGAG 


GAGTATCTAT 


ATTACTTTTC 


GGTATTATTG 


CAGCAAGTGG 


CTTAAGAATG 


TTAGTTGAAA 


GCAAAGTAGA 


TTTTGCGAAC 


AATCGAAATT 


TAGTTATAGC 


TTCTGTAATT 


TTAGTTGTAG 


GTATCGGTAA 


TTTAGTATTT 


AACTTAAAAG 


AAATTGGTAT 


CAACCTTCAA 


ATTGAGGGGA 


TGGCATTAGC 


TGCACTTTCA 


GGAATTATTT 


TGAACTTAAT 


CTTACCTAAA 


GAGAAAAAAC 


AAAACAATTA 


AGATTTACAA 


ATTAAGGAGG 


GCGCTTTTAT 


GAATCATTTA 


TTATCAATGG 


AACATTTATC 


TACAGATCAA 


ATATACAAAC 


TTATCCAAAA 


GGCAAGTCAA 


TTTAAATCTG 


GTGAACGTCA 


ACTACCAAAC 


TTTGAAGGGA 


AaTATGTCGC 


AAATTTATTC 


TTTGAAAATT 


CTACTCGrAC 


AAAATGTAGT 


TTTGAAATGG 


CAGAACTTAA 


GCTAGGGTTA 


AAAACGATTA 


GCTTTGAAAC 


ATCAACATCA 


TCTGTTTCAA 
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TCATTAGACA TCCGTTTAAT AACTACTATG AAAAATTAGC GAATATTAAC ATCCCAATTG 720 

CGAATGCTGG TGATGGTAGT GGACAACATC CAACACAAAG TTTACTTGAT TTAATGACGA 780 

TATATGAAGA ATATGGATAT TTTGAAGGCT TGAATGTATT GATTTGTGGA GAcATTaAAA 840 

ATTCACGTGT CGCACtAGTA ATTACCAnAG T 871 
(2) INFORMATION FOR SSQ ID NO: 549: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4 00 base pairs 

(B) TYPE: nucleic acid 

{C) STRANDSDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 549: 

20 TCAATCTAAT ATATACTTCA TGACTTCCCG CCAAAGGCGC AATCGTAGGA TTAGTCTGTT 60 

TATCGATAAG ATCTATTAAT ATTGTTTCTA CTTTAGATTC ACCTATTCCC GCAAATCTTA 120 

ATAGTTCAGA ATGTATAATT CGATTATGGT TTATAAAATG TGACAACAAT TCATTTTTCA 180 

CCATTGGTTG CATTTCTTTC GGTGGACCTG GTAATAAAAT AATTTGTTTG TTTTCAAAAT 240 

TCACCATCAT TCCTGGAGCC ATGCCATGAT GATTTGTTAA TACAGTTGAA CCTTCAATTA 300 

CTAAAGCCTG TTGTcTATTA TTAGGTGTCA TTTCTtGTCC TTGTTCCTCA aAAwAGCTTT 360 

CAATATATTG AAAGAAGGCT CATCAATAAC TAAATCTnTA 400 
(2) INFORMATION FOR SEQ ID NO: 550: 

35 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1523 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

40 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 550: 
ATACCTCCAG CTAGAATACC AGCGTATTTC ATAAAATACT TCCTCCATTC AACTATATCT €0 
ATATTTAATT ATTTAAATTT CGTTGCATTT TCCAATTGAA AACTCATTTT AAAATCAAAA 120 
CTCTAAATGT CTGTGTATTA CTTAAAATTA TACATATTTT GCTTATATTT TAGCATATTT 180 
TGTTTAAACC TATATTACAT TATATCAGAC GTTTTCATAC ACAAATAATA ACATACAAGC 240 
AAACATTTCG TTTATrATTT ATATCACTTA ACTAATTAAT TTATAATTTT TTATTGTTTT 300 
TAAGTTATCA CTTAAAAATC GTTTGGCaAA TTCGTTGTGA CGCTTGTCCA TCTTCTAATG 360 

55 



1487 



5 



10 



EP 0 786 519 A2 

rrTGTTTTAA TGCATCAATG AGTGCTGTTT GATTTTCAAC AATTGGACCT GGCAACTCTT 480 

TTTTATAATC CATGTAAAAA CCTCTAAGCT CATCGCCATA TTTATCTAAG TCATATGCAT 540 

AGAAAATTTG CGGACGCTTT AATACACCGA AGTCGAACAT GACAGATGAG TAGTCGGTAA 600 

CTAACGCATC GCTGATTAAG TATAAATCCG AAATGTCTTC ATAAtCTGAA ACGTCTTTCA 660 

CAAAATCATC ATGTTCATCA ATACGTGTCA CAACTAAATA ATGCATGCXTT AAlcAAAATAA 720 

CATArTCATC ATCCAGCGCT TGACGCAAAG CTTCTATATC AAAGTTAACA TTAAATTGAT 730 

ATGAACCTTC TCGAATCGCT TCATCGTCAC GCCAAGTTGG CGCGTACATA ATCACTTTTT B40 

IS TATCTAATGG AATATTTAAT CTTGTCTTAA TACCATTAAT ATATTCAGTA TCATTGCGTT 900 

TATGTCATAA TTTATCATTT CTTGGATAAC CTGTTTCCAA AATCTTATCT CGACTAACAT 960 

GAAATGCATT TTGAAATATC GATGTCGAAT ATGGATTAGG TGACACTAGA TAATCCCACC 1020 

GTTGGCTTTC TTTTTTAAAG CCATCTTGGT AATTTTGAGT ATTTGTTCCT AGCATTTTAA 1080 

CGTTACTAAT ATCCAAACCA ATCTTTTTTA ATGGCGTGCC ATGCCATGTT TGTAAGTACG 1140 

TCGTTCGCGG TGATTTATAT AACCAATCTG GTGTACGTGT GTTAATCATC CwCGCTTTCG 1200 

CTCTTGGCAT CGCTAAAAAC CATTTCATTG AAAACTTTGT AACATATGGT ACATTGTGCT 1260 

GTTGGAATAT GTGTTCATAT CCnTTTTCA CACCCCATAT TAATTGGGCA TCGCTATGTT 1320 

CAGTTAAGTA TTCATATAAT GCTTTGGGGT TGTCGCTGTA TTGTTTACCA TGAAAGCTTT 1380 

CAAAATAAAT TAGATTCTTG TTTGGCAATT TTGATAGTAA TTTAAAAGTC GTATATATAC 1440 

TATGTTCTAT CAATTTTTTA ATTGTATTTT TAATCATGTC GTACCTCCGA CGTGTTTTTG 1500 

TAATTATATT AATATGTATG AGC 1523 
(2) INFORMATION FOR SEQ ID NO: 551: 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4923 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi> SEQUENCE DESCRIPTION: SEQ ID NO: 551: 

CAGTAAGAGA TTTTCTTAAT TGAAAATAAT CTTACTGCTT TTTTAAATTT AATTTCGAGA 60 

TTCAATATTA GTTTATCTCA TTGTGGCATT AATTGATAAA ATTGTTTTAA TGTTATAAAT 120 

CAAAGTCtTC TTCAACAATT TCAATGTCTG CATCAGATCT ATGATATGTG AAAAAGCTAA 130 

TTCTTATGCG GTCTAAATGC TCTAAATGGT GTCGATACTC TTCGATGGCT GCAACAATTT 240 
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ATGTGGACAA TAAATCTTTT TTCTGCGGAT TATCTAACTC ATAATCAACA TGTGTCACAT 360 

TATAACGTGC TTTTTTAGAA AGGCTAGCTA AAATTTGCTC GTGAAAAGCA GTTAATGAAT 420 

CTAAATCTAA TTTGATTTGT AATAGGAAAT TGTTATTAAG TAAATATAAG TCGTTTTGAT 480 

AACGCGACAA TTTGTTTAAT ACTTCATAAG CTTGTCTAGT CGTCTGAACT ACTTCTCTGA 540 

AAAGTATTTT CTTTCTATTC TGTTGGTGAA TATGTTTTTT TGTAATAGGA CGTTCTTCGC 600 

TATAGTAATC ATAAATTTTC TCTAACTTTT CGACACGTTG TTTTAAATTA TGACTATCTT SSO 

GTTTAATATT ATTAAACTCC GTCGTATCAT TTAATACTAA TTTAAACCAC ATAAAAATAT 720 

CTGAGGATAT ATTTAATGAA TTATAGTAAA TTTTTGTTTC AAATTTAGGT GGTAGAAACA 780 

CAAAGTTAAC TAGAGATGAA CTTATGACAC CAATCATTAC AAGTACAAAC CTGTAAAAGG 840 

CGGTAATATA GAAAGAACCG GTATGTTGTC CCATAATGAT TAATCCTGTT ACACTCGCCA 900 

20 AAGTAGCAAC ATGTGCTAAA TTAAATTTAA ATAAAATAGC AATAAGTACT ATGACGGTAA 960 

CACCCATAAT GATAAAATTA TCACTAAAAA TTGTTACCAT TGTAACAGAT AGTATGGCAC 1020 

CTATAATGTT ACCCAATGCT TGATCAGAAA CTGTTTTAAA TGAACGATAA ATACTAGGTT 1080 

GCATTGCAcA ACAGCACTGA CACCAGCTAA GGCTTTCAGA CCAACATCAT CCGGTAGTAA 1140 

AGAAGCGATA GACATAGCTA AAATAATGGC TATACCAGTT TTAAAAATCC GAGCTCCTAG 1200 

TCTCAAAAAT AATGACGCCC CTTTTAAGTT TATTGAATAT CTAATATTCG TATTCATTAC 1260 

TGTTATACAC TTACTAGTTA CAAAATTCAA GCTTATTTAT AGTTGTTAAA ATAAATCATA 13 20 

CATAATACTG ATAGCGATGT AAAACTTTAG TCAGAGATTA AAATAGTATA AATTTGTAAA 13 80 

ATAAAAACTC ACATAGTGAC ATATCAAGTT AAACGTTAAT AGTTAACGAT ATAAAATGAA 1440 

TCTACTATGT GAGCATTTGC TTTATTTTAA TTCAATTAAA AATATACTTC CTTAAAAGTT 1300 

ATTTCATTTG ACTAAAAGCA TAGTCTGCAG CTTTTAAAGT TTGTTTAATA TCTTCTTCTG 1560 

40 TATGTTCAGT TGTTAAGAAC CAAGCTTCAA ACTTAGAAGG TGCTAAATTG ATACCTTGAT 1620 

TTAACATTAA TTTGAAAAAT TTACCGAACG CTTCGCCGTC AGAATGTTCA ACTTGATCAT 1680 

AATGTGTGAC TTTTTCATCT GTAAAGTACA ATGTTAAAGA TCCATAAATA CGATTAATTG 1740 

TAGCTGTGAT ATTATGTTTT TCGATTAATT TAAGTAAACC TTCTTCTAGT TGTTGGCCTA 1800 

AGCTGTCTAA TTTTTCATAA ACACCGTCTT GTTCTAGTAC TTCGAGTAAT GCAATACCTG 1860 

CTTTCATAGA TAACGGGTTA CCAGCCATTG TACCAGCTTG ATATGCAGGT CCTAGAGGTG 1920 

CTACTTGTTC CATAATATCT TGACGTCCAC CATAGCCTCC AATTGGTAAA CCACCGCCAA 1930 

CAATTTTACC AAATGCAGTT AAATCAGGGA TAACACCTAA TAAATCTTGA GCGGCACCGT 2040 
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AAATTTCATT AACCTCTTCT AAAAATCCAG 
CAATTGGTTC TACTAATACT GCGGCAATTT 

5 

AGGCGTTAAT ATCATTGAAA GGTACAGTAA 
CAGCTGAGTC TGGAGAACCG AGCTGAGATG 
CAGAATGOCC ATGATAAGAT CCAGCAAATT 

10 

GTGCAACACG AATTGTTGTC ATGACTGCTT 
CAAGAGATGG AATTGCATCA CGTAATTTTT 

t5 TACCAAATAA AACACCTTTA GCAGCTTGTT 
CATGCCCCGT AATAATTGGA CCGTATGCrT 
CATCATATAA ATATGCACCG TGTCCTTCTT 

20 CTTTATAAGA ACGAGAAGGG GAATTGACAC 
GTAAACGTTC ACTTTCACTA AAATTCATTT 
TCTAATATCG TATCATAAAA TTATTATAAT 

25 

GGAGAACAAT TTCCAATATT TAAATTAGAA 
ACATTAAAAG GTAAAAAGGC GATTATATAT 
ACCACAGAAG CTTGTGACTT TAGAGACAAT 

30 

GTATATGGTA TAAGCGGTGA TTCAAAGAAA 
TTGAATTTCG ATTTATTAGT AGATGAAGAT 
35 AGTTAAAAAA ATCATTTGGC AAAGAAAGTA 
ATGAACAAGG TAAAGTATTA GATGTTATCG 
AACTTAAAAA CATTTTGGGG TGACATATAT 
AGTTGAAACT GAATTACAAC AACGCTTTTC 
ATCAGAAATA CCTGAGAGCG ACTTGGCTGA 
TATCAATGAG GCATTTTTAC GACGTTGCCC 

45 

GGGTGTAAAT ACATTGCCGT TAGATTATAT 
AAAAGGTGTT CAAGCTAAAC AATTATCTGA 
TAAAAAGATG AAACTATCAT ATGATAACCA 

SO 

TGGTAAACGC CTATCAGGAC AAACAGTTTT 
AACTGCGAAG TTAGCAAAGG CTTTTAATAT 

55 



GTTGAGGCAT TACCATTCCA AAGTTACCAA 2160 

CATCACCCCA AAATTCAATT GCTTCTTTAT 2220 

TGACTTCACG TGCGACGCTT TCTGGAACAC 2280 

GGCCGCTACC TGCTGCAACC AATACTAAAT 2340 

TTATAATTTT AT TT C T T TTA GTATATGCAC 2400 

CTGTTCCAGA ATTTACAAAG CGAATTTTCT 2460 

TGCTGAATTC AATTTCTAAT TCAGTCGGTG 2520 

CTTGAATTGC TTTAGTAATA TGAGGATGTG 2580 

GAAGGTAATC AATAAATTTA TTGCCATCGA 2640 

TCATAACAAC AGGTGCACCG CCTCCTACAG 2700 

CGCCTAGAAT ATATTCGTTT GAAAGTTGTT 2760 

ATATCAACCT CTTTTAATTT AATATTTTCA 2820 

GAAGAAAAAG GTGATTATAT GTTGCAAAAA 2880 

AATCAAGACG GAACTGTCAT TACAAATGAT 2940 

TTTTATCCTA GAGATAATAC ACCTACTTGT 3000 

TTAGAAATGT TCAATGATTT AGATGTTGCA 3060 

AAACACCAAA ATTTTATTGA GAAACACGGA 3120 

TTTAAATTAG CTAAAGAAAt GGCGTATATC 3180 

TGGGCATTGT AAGAACGACT TTTATAATAG 3240 

AGAAGGTTAA GGTIAAAACA CAAATAGAAG 3300 

GAAAGTTGTT GGGTTAAATC GTATGCGTGA 3360 

AGATTTAGAT TTTAAATTTT ATAAAAAAGC 3420 

TTTAGATATA TTAGTTGGTT ATGATGGCGG 3480 

GAATTTAAAA TGGATTGCAT GGTTTGCAAC 3540 

TGCAGATCAC GGCATACTTT TAACTAATGG 3600 

ATACATTTTA GCTTTCATTT TAGATGATTA 3650 

ACGACAACAT ATATATGATT CGAAAATAAC 3720 

ATTTTTAGGT ACAGGTGCAA TTGCTACTAG 3780 

GAATTTAATT GGTCTGAGCA AGTCAGGTCA 3 340 
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TGCTGACATT ATTATAAATG 
AAAACATTTT GAATTAATGA 
AGTTAAAGAA GCGCTCTTAA 
AGATGTGTTT . GAAAAIGAAC 
AACTATAACA GCGCATATAA 
TTTTAAAAAC AATCTAGTTA 
TGCTAAAAAA GGCTATTAAA 
AGTTATATTr aXAGTAAgTt 
TTGAAATAGA ATCAATTGAA 
GCGTAAGAAT TACACCTCAA 
ATCCAACAsC TGdTGaAATT 
CGACAATATA TAATAACTTA 
ATGGAGACTC ATCAAGTCGA 
AACAATGTGG TAAGATTGTT 
CTCAGCATAT GACTGACTTT 
AAGAATGCCA AGATAAATAA 
ACTTCATATA AGTAAGCGTA 
TTT 



CTTTACCAGA AACGCAAGAA 
AAGATGAAGC ACTTTTTATA 
TAGAAGTATT AAAAAGTAAA 
CTTTGAAACC TAATCATGAA 
CTGGTAATGA TTATGAAGCA 
ATTTTCTCAA TAAGAATGGT 
TGArATCATC ATGTAAATAT 
AATaATgATT ATATAAGAaA 
CATGAACTAG AAGAATCAAT 
AGACAAGCAA TATTACGTTa 
TATCAAGCAC TTTCACCTGa 
AGAGTGTTTA AAGATATTGG 
TTCGACTTTa ATACACATAA 
GATTTTCAAT ATCCACAGTT 
GACGTAACAC ATCATCGAAT 
TTTAACTTTG GTAGTATGAC 
ATATTTAAGA nGTTAAACGA 



ACGATTCaTT TaCTAAAGAA 
AATATAGGAC GAGGTAGCAT 
GTTATTCGAC ATGCATATTT 
TTATATGAAT TGGATAATGT 
AAGTATGACT TATTAGATAT 
CTAATTGAGA ATGAAGTTGa 
TGACACGCGC GCAATACTAC 
GATGGTgATA TAGATGAGTG 
TGCATCATTG CGACAAGcAG 
TTTaATTTCT TCACATACTs 
TTTTCCAAAT ATAAGTGTTG 
AATTGTAAAA GAATTAACAT 
TCATTATCAT ATTATATGTG 
AAATGAAATT GAAAGATTAG 
GGAAATTTAT GGAGTTTGTA 
AAATTAAAAA AGCGTTACTw 
CATGaAAGTt GTTTAACTTT 



(2) INFORMATION FOR SEQ ID NO: 552: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 917 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDBDNES5 : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 552: 
TCCGGCTTTA AAAACTTTTC CCAATTCCAG CTTGGGCCTT TGGCATTAAT ATTAACCTCC 
TGGTTCGGAT TAATTGGGAA CCTAACCnTT TAGGCAATAA TTGGTTTAGG CAACTTCCAA 
ATTGGTGGTT CAACCAACGT CTTTGGATAC CyTGcTCATT TAATTCTAAA ATGgTyrGAA 
CGCATTTTGG TACCCAAAAt GgTGACGTTC GTTTGCACGG- TCTAATAAAT TGTCTAAGTT 
GTCGATTGGT TTCATTAATT GAaCACCATT TTGCTCTTCA GCAAGACCTT TGTCTACTTT 
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GCGATCCATT GTTTGTTCGA AAAGAATAGC ACCCAAAATT TTATCTGGTG AGAATGAAGG 
TGAAGTTACC ACACGTGTAC GCATATCGTG AACAAGTTGG AACATTTCGT CTTCATTGCT 
ATATTGATCT TCGTTTACAC CATATTCTTT AAGTGCTTTT GGTGTACTAC CACCACTTTG 
GTCTAATGCG GCAATAAAGC CTTTTCCATT TTTCATTTTT TCTAATTGCT CTTTATTCAT 
ACTTTCCACT CCTTAACTTT TCAATACACC TCCAGTATGA TAAAAATGAG AACATTTCTC 
AAGTCATAAA CCTTGAAAAG TGTATAAAAT GTGAAAAATA ATTGTCAGTT TAATTAAAAA 
TATTATTTTA TTCTAGGTAT GACTAACGCC ATTAATGACA TAAAGAAAAT ATGTGTAATA 
ATCCAACCX3A TTAATTCTGT CACACTAAAT TGAAAAATTG GACGTTGCGC AATAAATACT 
AAAAAGGGAT ACAATGCTAT AAATAAGAAA AATAAAGGGA TATAACATAG ATAGTAAAGC 
CrnTAGAAG TATGAAA 

(2) INFORMATION FOR SEQ ID NO: 553: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 432 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNES5 : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 553: 
ACTCCCATAT CCACTGGCAA GATTTATAAT TTGTAATTCT AAAGTATAAT AGCCTATATT 
TTTCAAAATC TCTTTTTTTA TGATTAACAT CCCTCTAAGT GCACCTAAAG GTTTTTATGT 
AATGTATTAA ATATTTCCAT TTATACATAT ACATCTTGTA TAAAAAGAAA GAACTCCATA 
TATACTCAAA AGGTATACTG AAGCTCTATA TATTATATAA AATTATTATA CTATTTTGAA 
AAACATAAGT AAATCACTAA ACATGATTTC TTTCACTTTT AGAAAACTTT TAATACTATA 
AAAGCACCCA CTCAGTCACT AGTTTGGGCA GTTATTGTAT GCCTATTGaA CTCAATGCgT 
ATATTACAAT ACCTTTTtCG CATATTCATA TAAGacTTTG CATCTTTAAG CTTAATTGCT 
ATCTCTTTCT CT 

(2) INFORMATION FOR SEQ ID NO: 554: 

(i) SEQUENCE CHARACTERISTICS: • 

(A) LENGTH: 1374 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNES3: double 

.(D) TOPOLOGY: linear 
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TTTTGCTTTA TGTTAAATGG ATTATTaTTA GAATAAAAAA TCGGTGATGA GCTAAAAAAG €0 

TGTGTAGGAT GTTTTCCkAA CCCAATTTTT ACATCCGAAG ATATCGAACA ATATCTTCCT 120 

ACTTCTACAT TATTAAAATC ACTACCAAAT CCAATATAAC TGTATTCACC AATGTGAGAA 180 

TTCCTGATTT TACACCATCT ATCTATATAG TTATIGCCAT CAAATTTTGA GTTTGTAATA 240 

TACGCCAAGC GATGAATCTT AACATTCGAT TCTTTAGAGG ACTGGTTTTT CAGCAAACCA 300 

ATTATCTTTT CAATCGCTAT CCTCATCGTC ATTTCCTCCA AGTATTTCGA TTGATAATAT 360 

CTTTATAGCT TTGAATAATT TTAACTACCT TTGTCGAAAC GTTAGTGTCT TTATAATCAA 420 

TAGCATCAAT CATCGGTTCG TTATTGTTTT GCATCTCTCT TGCTAGTTCA ACGGATTGGA 480 

TTAGATTGTT ATAGGTAATA CCACCTACAA. TAACCGTACC TTTATCTAGT ACTTCCGGTC 540 

TTTCTGTGGA AGTTCGAATA AGGACACCAG GGAACTTCAA AATAGACGAC TCTTCTGACA 600 

20 ATGTTCCACT ATCTGATAGC ACAACAAATG CATCTTTTTG CAATGCATTA TAATCAAAGA 660 

AACCAAATGG CTTTAACTGT TTAACTAATG GATCAAATTC AAATTTACTT TCTTCAATTT 720 

TCTTCCAACT TCTTGGATGC GTTGAATAAA TCACAGGCAT TTTATACTTT TTGGCAATAT 780 

CATTTATCGC ATTCATTAAT GATTTAAAAT TCTTTTCATT ATCGATATTC TCTTCTCTAT 840 

GCGCAGaTAC TAAAATGTAT TGTTGCGGTT CTAATCCTAG TTTATTTAAA ACGTCACTGT 900 

GATTAATTTT ATCTCGATGC GCTTCTATCA CTTCTGTCAT CGGTGATCCT GTyACAAAGA 960 

TATTCGCTTT ATTGAAGCXTT TCATCTAATA AATAACGTCT GCTATGTTCC GTATAAGGTA 1020 

GATTCACATC ACTGACATGG TCAACAATTT TACGATTGAT TTCTTCAGGT ACATTCTGAT 1080 

CAAAGCATCT ATTACCCGCT TCCATGTGGA ACACAGGAAT CTTTAATCGT TTAGCAGATA 114 0 

CTGCTGCTAA ACAACTATTT GTATCACCAA GAATTAAAAG TGCATCTGGT TGTTCGCGTA 1200 

ATAAAACATC ATATGTCTTC GCAATAATAT TCCCCAtCGT TTCTCCAnGt TACTTCCAAC 1260 

40 TGCCTCTAAG TAGTGGTCCG GTTGTCTTAA TTCCAAATCA TCAAAGAAAA TTTGATTCAA 1320 

TGTATAATCA TAATTTTGAC CAGTGTGTAC TAATATCTGA TTAnAAATAT TGAT 1374 
(2) INFORMATION FOR SEQ ID NO: 555; 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 14 72 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 555: 
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TTACCTCTAG GCATGTCCCT TTCACGGTTT GCTTATGATA ACGTTATCGA CATTGTTAAA 120 

TTGTCCTTTT TGAAAAAATA ATTCTGGTGA GATAGACGCT ACTTGGaTTT CaTCaGTTTG 180 

^ TAAtAACGCA GtATAAtTAC CaTTACTAAA tTGaGTTAAT CGTTCaTATA AAGTACTAAT 240 

AGGATAATAA ATGTTATCCG TTAAgCGCGC CGTATAGTTC ACTTGATACG TTTCGCCTTC 300 

AACAATTGCT TGTTGGACAC GTTTAATATT AGTCATCATA ACCTCAGAAG ATTCAACAAA 360 

10 

TGAAAAATGA TACTTTGATA CATAAGAAGT TTGATGTTCA TATGTTGAAT TTATGCTTTC 420 

CGCTTTTTCA AAACTATAAG CTGCTGCATA AATATCATCT TTAGCTAATG AATGTGTACA 480 

CATAGCATGA TTAAAATACT TTGCCGCTTC GTAACTTAAA TATAACGAGA CATATCTACC 540 

TTGTCGTkGt GCGCITGTGC AAAGTGTATC ACTTCTCCCA CATCAGCCAA CTTAGTAGCA 600 

ACATACTTCT TTATAAATCC CTTTAATTGA ATATGGTATT GCTTATATTC ATTTTCAGTT 660 

20 AAATAGTAGC GATAATTATA TTCTATTCTC ACAGTAATCA CCTACCTTCG ATAAAAATAA 720 

TTCAACTTGT CG ATAACCGT ATTCACTCAA AATAGATTCA GGATGATATT GCACACCAAA 780 

AACCGGAAAT CTAATATGCT CAAATGCCAT AATAATCGCT TCATCGTTTT TTGCTGTAAT 840 

CTTTAAGCAA TTTGGAAAAG TCGCTCCGTC AGCAATTAAT GAATGATAAC GCATTACATT 900 

GAAATTTTGA GGCAGTCCTT GAAAAATACC TTCATTGGTA TGGCGTAACT GTGTAGTATG 960 

TCCGTGTACA GGATGATAGC CGTGAATGAT ATTTCCACCA AAATAAGACA CG ATACATTG 1020 

30 

AAATCCTAAA CATACACC7A GTATAGGTAC ACGCTGATAA AATTGTTCTA ACACTTCATT 1080 

CAAGATAGGA TAATCATCCG GaTTACCCGG CCCAGGCGAA ATAACAATTG CTTTTGGCTT 1140 

35 CATATTAATG ACGTCTTCTA TCAGCAGATT ATCAATACCA ACAACTTGAA CTGTTAGTTT 1200 

CGTTTGAGTC TTAATATAGT CTATTAAATT ATATGTAAAT GaATCATTAT TATCTATGAC 1260 

TAGAATCATT GTATACTCCG TTCTAAATGT GTTTTATTTT TATAATATGT ATTGGATGTA 1320 

^0 GCTAAAACTT TAAAAGCATT GTCATTATCC TGACCTTGAT TTTAACTAAT ATATGGTATA 1380 

TTCTATTCAT CGTACATAAA TGAATATCAG AGGTTCCTAG CTGAAACCCT CTATAAAAAA 1440 

CTAGGCCATT GAAATTTCAA ACATTCGTTG GG 1472 

45 

(2) INFORMATION FOR SEQ ID NO: S56: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 10=4 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNSSS : double 

(D) TOPOLOGY: linear 
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AGAACAGCAA GGATTACTTA CTGAGGAATT AAAGAAGGAT ATTTTAAAAC AGAACAAATT 
ACAACGTGTT GAAGACCTAT ATAGGCCTTT TAAACAAAAG AAAAAGACAA GGGCAACTGA 
GGCGAAACGT AAAGGGTTAG AGCCATTAGC GATATGGATG AAGGCACGTA AACATGAAGT 
CTCAATTGAA GAAAAAGCAC AACAATTTAT AAATGAAGAA GTGCAATCGG TTGAAGATGC 
TATCAAAGGT GCACAAGATA TTATTGCGGA ACAAATTTCA GATAATCCTA AATATAGAAC 
AAAAATTTTA AAAGATATGT ATCATCAAGG TGTGTTAACT ACATCTAAAA AGAAAAATGC 
TGAAGATGAA AAAGGTATTT TTGAAATGTA CTATGCATAT AGTGAGCCAA TTAAACGCAT 
TGCTAATCAT AGAGTTTTAG CTGTTAATCG TGGTGAAAAA GAGAAAGTAT TATCTGTAAA 
GTTTGAATTC GATACGACAT CAGTAGAGGA TTTCATTGCA CGTCAAGAAA TCAATCATAA 
TAATGTAAAT CGCAGTTATA TTTTAGAGGC GATTAAAGAT AGCTTGAAAC GCTTAATTGT 
CCCTTCGATA GAGCGTGAAA TCCATGCTGA TTTAACTGAA AAAGCTGAAA ATCATGCAAT 
AGATGTTTTT AGTGAAAACT TAAGAAATCT ATTACTGCAA CCTCCAATGA AAGGTAAACA. 
AATATTAGGC GTAGATCCAG CATTTAGAAC AGGTTGTAAA TTAGCAGTCA TTAACCCATT 
CGGTACTTTT ATAGCAAAAG GTGTGATTTA TCCGCATCCA CCAGTTTCTA AAAAAGAGGC 
AGCAGAGAAG GATTTTGTAC AAATGGTTAA AGCGTATGAT GTGCAATTAA TTGCAATTGG 
CAATGGTACT GCAAGTCGTG AAACAGAACA ATTTGTTGCA GATTTAATTA AAAAGCATCA 
GTTGCCAGTA CAATTCATCA TTGTCAATGA AGCGGGCGCT TCAGTATACT CAGCATCAGA 
AATTGCTAGA GATGAATTTC CTGATTTTCA AGTG 
(2) INFORMATION FOR SEQ ID NO: 557: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1057 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



60 
120 
IBO 
240 
300 
360 
420 
480 
540 
600 
660 
. 720 
780 
840 
900 
960 
1020 
1054 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 557: 
AAATGTCAGA ATACAAGAAA AAAATAATTG AATTAATTGA AAGTAATTTA ACAGGATATG 
AAATTTCTAA AAAAACTGGA GTTTCTCAAT ACGTACTTTC ACAATTAAGA CAGGGCAAAC 
GCGAAGTAGA TAATCTAACC CTGAATACAA CAGAAAAATT ATATGAATAT GCCAATAAAG 
TTTTGTAATT TAACTAATGT ATAAATTAAT CAAGCTATGT TTATTTGATT TAACTATTAA 
TAAAAATCAT ATGGTGAATG GATATTATAA TAATTAAAAT ACAAAAATAG TAGATTCCAA 



60 
120 
180 
240 
300 
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AAGGGAAAAT AAGTGTTAAG TTTTAAATGA TAAAAAAGAT 

TGCTCCCTTC AAAGTTTTCA TTTTTTCAAT GTCGACTTCG 

5 

TTGTTATAGC TTTTTATATT TGTATAATGA ACATATAAGT 

GAAATAAAAA AGCTCAAATG TACCAAATTG TTAATCTTAA 

ATTGAATGGA CATTCGAGCG TTAATCAGTC AGGAGGGACT 

10 

ATAATACTTG CTTCACCACT ATACAAGGAG TGAGTTGTTA 
ATTTTAAGTT ATTATCCAGA ATATAATATC GCAGTAAGTT 
,5 AAAACAATAA AAAACAAGAT TTAATACTGC TGCGTCATGA 
TGAATAAGTA TAATTTCAAC TATGATTATG CACATAAAAT 
ATTCAATTTT TATAAAAaAG AAGGTGGATT AAATGCTTAC 
GATGaACAGG tTATAATATA TGraTATATa CCTGaAGATG 
GTCCCGTACC TTTTTAATTA AAAAAGTTCC AGGGGGT 
(2) INFORMATION FOR SEQ ID NO: 558: 

2S 

. (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3754 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

30 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 558: 

35 CTGTGCTGTA TTTACtTTAA TTTGACGACA TTTGAGAAGT ATTATGATGG nTGTAGTTAT 60 

TTTATGAAAG TAATGTATTA ACAATCGAAT TACTAAGTCT ATATTGGTAG GAATATCGAT 120 

GTTTAGTTTA AATGGAATGC ACTATTTAAG TTTTTAATAT GGAGATGTTT GTGACTTTTC 180 

GATGATTAAG ATTTTTATAG GTGTGCATCA TTTCAAATAA ACTTTGTGTT TAAAATTGAG 240 

CTTAGGAAAT CGATAGGTTT AGATGAGGAT ATTGTTGAAG TTATGTGTCT TGTATCCTTA 300 

GTTGTTATAA AAGCGCAAAA AATAGCACCG CTTTCTCTTT ATCTGTGTAG AAAGGATGCT 360 

45 

ATTATTGTAA AACAATAGTT TTAATTTnAT TTTCTGATaT ATCATATGTr ATTcTACCTG 420 

TATCAATTTC TATCGAATTA TAACCATCAA AATTATCAAC TTTATCATCA AAGTCTATCA 480 

CTTTTCCAAT TAATATTTTA TTATTAGTAA GCGTTAATTT GACTAATTTG CCTATGTATG 540 

SO 

ACTGTAAATT CATATTTAAT CACTCCTTTT TAATATACGG AACTACATGA AAACCAGTTT 600 

TAGAATAATG AACCTTACCT AATTTCGTTT CAATATATTT ACCATTCACA TAAGATTTAC 660 

55 



TGGAATGGAT CGTCTTGAAA 420 

AAGGGGGCAT TTTCATTAAA 480 

TTAAGAAGGT GCGAGTGAAG 540 

TAAATCTCTA CTTTATAAAG 600 

TTCCCTCCTA CAATTTAATA 660 

TGTTCAAAGT GAATTATTCG 720 

GGCAACGTTT AAGAGAAGGA 780 

GGCGCTTGAA CATTATTTGA 840 

TGTATCAAAA AAATACGATT 900 

ATTAATAAAA TTGGAAAGAA 960 

aTATAAGTAC CGGGTAAAGG 1020 

1057 
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AAACTGGAAT ATCAATAAAT TCTTTTTTAG 
TAGTATAACT TGGTAATAAA GATGAATTAT 

^ AAATATGACG CTTTTGCTTA ACATTATTCA 
TTTCAAGCAT TTCTTTTTTA GCTTTTTGTA 
AATCTAATAC TTTTTATCTC AGTTTCATCA 

10 

TCTACAACAA GATTTCCTGT TTCGCTCTCG 
TCGTATTCTT CATTATTCAA AAGCGTGATA 
CTCAATACTT TTCACCTACT TATCAATATA 
AATGGCACTT cCCTTTCTGG TTTCAATATA 
TTGATTAAAA TTAATAATCT CTTTCAAATC 
20 TGTTGACATT TTTTCTCTTA ACAATTCATT 
AGGCAATTTC TTATTATTTA AAATGGCTCT 

* • 

TAACATATAT CTATTTTATT TTCCGCAATT 

25 

CATTTCTTTC ATCTGGTTTT TAGCTTTTtC 

ATATTTACCt TCACGCTCTT TAAAGAACTT 

GGTACTTCTA CACCAAGGAT GCATAGGTGG 

30 

TTTAAATATT TTTCCGTTAA GTGAATGACA 
AACATATTTA TATTCGCCAT CTTCACCAAG 
35., TGCATTTTCA GTAAATAGTT AAAAAAGCGT 
TCTAAAAAGG ATGCTATTTA TCTTTTGAAT 
CAAATTCrrC AACTAATTCT TTAAAAGATT 
CTAATTGTGA ATCTAACATA ATTAAAATCA 
ATAAAGTTTT TTCAATAATT TTTCAATATG 
ATATTTAGCA CAAAATTTAC TCACTATTTT 

45 

TTTTACTTGT CCCTTATTAG TAACGATTGT 
TGTAAATAAA TCATATTC7G AAAATCCTGA 
TGAATTCGGT TTACTGTTAA ATAATAATTC 

SO 

ACTATCTTGA TTGACATATA CTTTTGTAAA 
ATTGCTATCA TTGTTTTCCA TGAGATATAC 

55 



TCATCTTTTC ACTTTCATTA GAATCTATTA 780 

TTTTCTTATT ATTATATTCA TTTGTGCATA 840 

ATTTCATCGT CATTTTACCA TTACTTATCA 900 

GAAAGGATGC TATTTTGTAA TTAmTAAT 960 

AACGAATAAA CAGCAAAATC AGTCTGTATA 1020 

AATTCATTTT CATAGTCAGT TACAAACCCT 1080 

ATAACATCTT TACGATATGC ATCTnCAATT 1140 

AGGTACTATA TGaGcACCTG GTCTTCGAAT 1200 

CACATTTTCG ATATGTATTT TTCCAATAAT 1260 

AAATCGCTCA TCACTTAATA TTAGATTGCC 1320 

CAATAAATCT ATAGAAAGTA TTGTATAGCT 1380 

TTTTTTATTT TCATTATATA GGTGATGACC 1440 

TATTTCTATT TTTATTTTAC CATTTTTAAT 1500 

CTGtAATTAT GCTTCTTTTA CTTCTACTTG 1560 

GTCCCGCCAA TTGCCAACAT GTGGCACTGT 1620 

CGCATTCACA CCTGGTATCA TATCTTTAAC IS 80 

TAATTTAGAT GTTTTACTAT CTATTTTGGC 1740 

TTCTTTTAAA TATGTTAACT TTTGTGCTTC 1300 

ATAAAAATAG CACCACTTTC TCTTTAkCTG 1860 

TTGAATTCTT TTTCGCTTTT TCTATACTTT 1920 

CACTCAATTC TTTTGCAGTT ACATTTCCAT 1980 

TCrCACTTTA TATTTAATCa TATTTATACT 2040 

GCTATCATTA ATGATATTAA TATGCGTAAA 2100 

ACCATGAAAC CTATTTGACT TGGTAATAAA 2160 

CATTGATTTT ATTGATGGAT GCTTAAAAAA 2220 

CTGTCCAGGA TGGTTATGTA ACATAACAAT 2280 

GGTTGCTTGT TACCCTGGCA CAAAAGATAC 2340 

TTTACCATCT TTTAACAAAT AAGCTACTTC 2400 

CTCCGTTTAT AGtCTGTCGA CTGATATTCC 2460 
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GAAGGTTAAA ATTTTTAAAG TAAACTTTCT TTATCCCCAT GCTACGAGTT CAGATTCAGG 
AAATAGCCCT TTACTAGTAT TTATGTATAT TCTGTCTATG GCATGAATAA AATAATTATC 
TCTTGTATTT tTTTCTAAAC TAGATTTTTC AGCATTGATA ACTTCAAGAC TATCTATATC 
CATTTGAATA ATACCAGGCT TAATATTTTC ATCATTATTA GGAAAATATT TATATGTAAC 
ACTTTTATCA TTAATTTCTT TTATTTTTAA TATTAGCAAT CATTTCCACC TCTAATTAAT 
TAAAATACTA TAATTATATT TTATTTCTGT AAGTTTATGT GCCTCTATAT AGTGTAAATT 
ATACTTATTC ATTAGATAGT GTTCAAGAGC TTCATGTTTC TACATTATTA TATCCATTTT 
TTTAATATTT TTCCCTTCTC TTAAACGTTG CCAACTTTGA GCCATATAAA AGTCAGGATC 
AAATTGTTTA AATCCACTTT CTAATAAATA CTTATTTTCA AATATATGTT CATAAACTCT 
TTGAATTAAA TTTTTATTTA TATTAgTATT TTTAGCAATT TTAGAAATCT CTATCTGTTT 
ATCTCGATTT CTAACTGAAT TATAATAAAT TTGAGCATGT CTGTTCCTTT TGATACCGTA 
TTCATCACTT TTATTATTAA GTGCACCTGA TTCAATAAAA CAACCTTCTA CTTGATATTT 
ACCTTCACGC TCTTTAAAGA ACTTGTCTCG CCAATTGCCG ACATGTGGCA CTGTGGTACT 
TCTACACCAA GGATGCATAG GTGGCGCATT CACACCTGGT ATCATATCTT TAACTTTAAA 
TATTTTTCCG TTGAGTGAAT GACATAATTT AGATGTTTTA CTATCTATTT TGGCAACATA 
TTTATATTCG CCATCTTCCA CCAAGTTCyT TTAAATATGT TAACTTTTGT GACTCCTCyT 
TTTCAACGAA TAATGAAAAA AGCATATAAA AATAGCATCG CTTTCTCTTT ATCTGTGTAG 
AAAGGATGCT TTAATACCaT GCTATTTTAT AATTTTcGGG AAATTcTTGC TTCTCGATAA 
AGTCTCTTAC TACAGAAAAA GACTTATTAC GATATAACAT AAAATATTCT TCATTTTCTA 
TTTCAGATAA TGAGAAATCT ATAACCTCTG CATCTTTTTT ATTAAAAGTT ACTGAACCTT 
TACCGTTACT TATATCATCT TCAGGTATAT ATTC 
(2) INFORMATION FOR SEQ ID NO: 559: 
(i). SEQU2NCB CHARACTERISTICS: 

(A) LENGTH: 815 base pairs 

(B) TYPE: nucleic acid 

(C> STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 559: 
ATTTAACTAA AACTATAaAT AATCAAATGA TATTGGAAGA TATTaGCATA GATATCGAAA 
AAGGTAAATT GACTTCTTTA ATTGGACCTA ATGGTGCGGG TAAGAGTACT TTACTTTCAG 
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CTGATTATAA AAATAATGAC TTGTCGAAAA AAATATCTAT ATTAAAACAA ACAAACCATA 
CTGAAATGAA TATTACGGTA GAGCAGTTGG TAAACTTTGG ACGATTCCCT TATTCTAAAG 
GTCGTTTGAC GAAAGAGGAT CATGATATTG TCAATGATGC GCTAGATTTG TTGCAACTAC 
AAGATATCAG AAATCGTAAT ATTAAGTCAT TATCTGGTGG ACAACGTCAG CGTGCATACA 
TTGCAATGAC AATAGCACAA GATACTGAAT ATATTTTGCT AGATGAACCA TTAAATAATT 
TAGATATGAA GCATGCTGTT CAAATTATGC AAACGTTAAA AATGTTAGCG CATAAAATGA 
ATAAAGCGAT TGTCATTGTG TTACATGATA TTAACTTTGC GTCCTGTTAT TCAGATCAGA 
TTGTAGCATT GAAAAACGGA CAACTAGTTA AGTCAGATTT GAAAGATAAT GTCATTCAAA 
GTAGTGTTTT AAGTGATTTA TATGACATGA ATATTCAAAT TGAACATATA AGAAATCAAA 
GGATTTGTTT ATATTTTAAG GATTCATAAT TTGGAGaCAC TTTAAAGGGG TGATGCGCCA 
ATTAAAGAAG GGTTAAACGT AAAGCATTTA TTTAT 
(2) INFORMATION FOR SEQ ID NO: 560: 

(i) SEQUENCS CHARACTERISTICS: 

(A) LENGTH: 919 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 560: 
GAAACGAATA ATAAATTTAC TGAGTTATTA GTTGAAAAAG CTAATAAACA TGATGATGTT 
CTCGATAmGT TGATTAATAT TTTAAAATAA GCGATACACA CTACTAAAAT TGTATTATTA 
TTATGTTnAA TTGACnCCTC CTAAATTTGC AAAGATAGCA ATTTAGGAGG CGTGTTTATT 
TTTATTGACG TCTAACTCTA AAAGATATAA ATTAGACATT TACAAATGAT GTAAATAACG 
CAATTTCTAT CATCGCTGAT AACAATTCAT GGTTTAATAT GCAATGAGCA TATACTTTTT 
AAATAGTATT ATTCACTAGT TTTAACAATC AATTAATTGG TATATGATAC TTTTATTGGT 
TATTTTTATC CCATAGTGTG ATAATTACTA TTTTTCATTC ATAATAAAGG TTTAAAGCAT 
GTTAATAGTG TGTAAGATTA ACATGTACTG AAAAACATGT TTAACATAAT GATATAAGGA 
GTGACGTACA TGATCCGTCT AGGTAAAATG TCAGATTTAG ATCAAATCTT AAATCTAGTA 
GAAGAAGCAA AAGAATTAAT GAAAGAACAC GACAACGAGC AATGGGACGA TCAGTACCCA 
CTTTTAGAAC ATTTTGAAGA -AGATATTGCT AAAGATTATT TGTACGTATT AGAGGAAAAT 
GACAAAATTT ATGGCTTTAT TGTTGTCGAC CAAGACCAAG CAGAATGGTA yGnyGACATT 
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TATAAAGGAG CTGCTACAGA ATTATTCAAT TATGTTATTG ATGTAGTTAA AGCACGTGGT 
GCAGAAGTTA TTTTAACGGA CACCTTTGCG TTAAACAAAC CTGCACAAGG TTTATTTGCC 
AAATTTGGAT TTCATAAGG 
(2) INFORMATION FOR SEQ ID NO: 561: 

(i) SEQUENCE CHARACTERISTICS: . 

(A) LENGTH: 518 base pairs 

(B) TYPE: nucleic acid 

{C} STRANDEDNESS : double 
(D) TOPOLOGY: linear 

(xi> SEQUENCE DESCRIPTION: SEQ ID NO: 561: 
ATCATATAAA CCGGCTGCTT CTAAAAACGA AAATACTGTT ACTGQACCTA AAAATTTAAA 
CCCGTATTGT TTTAAATCTT TAGATAGTTG TGTTGCAGTA TCATCAACTG TGATACGATC 
AGAAGCATGT TCATACTGCA AATCTTTAGG CTTACCATTT ACATATGACC ATAAAAATTT 
ACTAAAACTA CCATATGCTT GTTCAATTTT TAAATACCCT TGAGCTTGAT TAACAATTGC 
TTCTAATTTT TTACGATGAT GAACGATATT TGGAAAAGTC ATTAAGCGGT CGATATCTTG 
AGCGGTCATT TGTGCTACCT TTTCTGGTTC GAAATCATAA AATGCTTCTT CATAGGCTTC 
TTTCTTTTTT AAAATAGTTA ACCAAGATAG CCCAGCATGT TGTGaTTCTA ATGCTAAAAG 
TTTAAACAAT GCCTTGCnAT CATAGAGCGG TTGTCCCCAT ACATGGATCm TGATAGTCTA 
AGTAGACTGG GATCTTTAGT ACCAAATGCG CATTCATT 
(2) INFORMATION FOR SEQ ID NO: 562: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 153 9 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 562: 
CTTATTTAAA AGTAAATCAA TCAATGTATT ATAATCCGAA TAGTCCGCAT AAAGCTGGTT 
TGCaGGCAAA tCAATTACTA CAACAAGCAA AAACCCAAAT TAATGCAATG rTTaATTCAA 
AAACAAATTA TGATGTTGTA TTCACTAGTG GTGCAcTGAA TCCAATAATC TTGCTTTAAA 
AGGTATTGCC TATCGTAAAT TTGATACAGC GAAGGAAATA ATTACATCCG TGTTAGAGCA 
TCCGTCCGTA TTAGAGGTTG TAAGATATTT GGAAGCACAC GAAGGATTTA AAGTTAAATA 
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CAAAGTCGGT TTAGTAACAT GTATGTATGT- AAATAATGTA ACTGGACAAA TACAGCCTAT 
TCCACAAATG GCTAAAGTTA TAAAAAATTA TCCTAAGGCA CATTTTCATG TAGATGCGGT 
TCAAGCATTC GGCAAAATTT CAATGGATCT CAATAACATA GATAGTATTA GTTTAAGTGG 
ACACAAGTTT AATGGTTTAA AAGGACAAGG CGTCTTACTT GTAAATCACA TTCAAAATGT 
TGAACCAACT GTCCATGGTG GTGGTCAAGA ATATGGTGTT AGAAGTGGAA CAGTTAATTT 
GCCAAATGAT ATTGCAATGG TTAAAGCGAT GAAGATAGCT AATGAAAACT TTGAAGCATT 
GAATGCATTT GTTACTGAGT TAAATAATGA CGTCCGTCAA TTTTTAAATA AATATCATGG 
AGTTTATATT AATTCTTCAA CTTCAGGTTC ACCATTCGTT TTAAATATTA GTTTTCCTGG 
CGTAAAAGGT GAAGTATTAG TTAATGCTTT TTCAAAATAT GACATTATGA TATCTACGAC 
AAGTGCTTGT TCATCTAAAC GTAATAAATT AAATGAAGTA TTGGCTGCAA TGGGATTATC 
AGACAAATCT ATTGAAGGTA GTATAAGATT ATCATTTGGG GCTACTACAA CTAAAGAAGA 
TATAGCGAGG TTTAAAGAAA TATTTATCAT CATTTATGAG GAAATTAAGG AGTTGCTAAA 
ATAATGAAGT ATGATCACTT GCTTGTTAGA TACGGGGAGT TAACATTAAA GGGTTCAAAT 
AGAAAGAAAT TTGTAAATCA ATTAAGAAAT AATGTAAATA AGTCaTTAAA AGGACTTGAT 
GGGTTTGTCG TTAAAGGCaA ACGAGATCGT ATGTATATTG AACTTGAAGA CCATGCaGAT 
ATAAATGAAA TAACATATCG ATTATCAAAA ATTTTCGGTA TTAAATCTAT TAGTCCAGTA 
TTAATVAGTAG AAAAAACA2^T AGAGGCAATA AGTGCAGCGG CAATTAAATT gCGCAGaATT 
TGAAGaAAAC AGCACATTTA AAATTGATGT GAAGCGTGCC CGATTAAAAT TTCCCCAATG 
GATACGGTAT GGAATTACAG CGTGGAATTG GGGTGGTGCC AGTATTGGAG CACTTCGCCA 
TATTTCCAGT GGATGTCCAA CGTCCCAGnC CCAGGAATT 
(2) INFORMATION FOR SEQ ID NO: 563: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 968 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



420 
430 
540 
600 
660 
720 
780 
840 
900 
960 
1020 
1030 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1539 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 563: 
ATAnCGTATA CATGTGTTCT TTAAAATTGT GATAAGGAGT TTAGGATGGT TTATTTAAAA 
TCAATAGATG CCATTGGATT TAAGTCTTTT GCAGATCAAA CCAATGTTCA ATTCGATAAA 
GGTGTAACTG CAATTGTTGG TCCAAATGGA AGCGGTAAAA GTAATATTAC AGATGCTATT 
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ATCTTCTCAG GTGCAGAACA TCGCAAAGCT CAAAATTATG CTGAAGTACA GTTAAGATTA 300 

GATAATCATT CTAAAAAGCT CAGTGTTGAT GAAAACGAAG TTATTGTAAC AAGAAGATTG 360 

TATCGAAGTG GTGAAAGTGA GTACTACATA AATAATGACC GTGCAAGATT AAAAGATATT 420 

GCCGATTTAT TTTTAGATTC TGGATTGGGA AAAGAAGCGT ATAGCATTaT CTCGCAAGGT 430 

AGAGTTGATG AAATACTAAA TGCTAAACCA ATTGATAGAC GTCAAATTAT TGAAGAATCG 540 

GCTGGTGTAC TTAAATATAA AAAACGTAAG GCTGAATCAT TAAATAAACT TGACCAAACA 600 

GAAGATAATT TAACGAGAGT AGAAGACATT TTATATGATT TGGAAGGTCG CGTAGAACCT 660 

CTAAAAGAGG AGGCAGCTAT AGCTAAAGAA TATAAGACAC TTTCACATCA AATGAAACAT 720 

AGTGACATTG TAGTTACAGT sCACGATATT GATCAATATA CAAATGACAA TAGACAATTA 780 

GATCAACGTT TAAATGATTT ACAAGGCCAA CAAGCAAATA AAGAAGCTGA CAAGCAACGT 840 

20 TTAAGCCAAC AAATTCAACA ATATAAAGGT AAACX3TCATC AACTTGATAA TGATGTTGAA 900 

TCgCTTAATT ATCAATTAGT AAAAGCTACG GAAGCCTTTG AAAAATATAC GGGACAATTA 960 

AATGTTTT 968 
2^ (2) INFORMATION FOR SEQ ID NO: 564: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 436 base pairs 

(B) TYPE: nucleic acid 
30 (C) STRANDEDNBSS: double 

(D) TOPOLOGY: linear 
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ixi) SEQUENCE DESCRIPTION: SEQ ID NO: 564: 

TTGTGTGTAT GCATTCAATG TGCTCTGTTT GTAAATGGCT AGCTATATAA TTTAgGATTC 60 

GAGGATCGTC ATCGACAACA AGACATTGCA CCATAGCTAT AAACTCCCTT ATCTTTTTCA 120 

40 TTTATTATAC ATGTAAAATA TTTTTGCGTA AAAAAACAAT TGTTCATATT GAGTTCATAT 180 

TTCAACCTTA TACTGACGCT AAAGAAGAAA TAGGGAGAAG TGAATCGATA TGAAATTAGC 240 

GATAAAAGAG ATTATGTTTT ACAAATTTCG TTATATTTTA ATCACATTAA TCATTCTTTT 300 

ATTAAGTATT ATGGTGTTAT TTATTAGTGG TTTAGCTCAn GGGCTTGGTA GGGaGAATAT 360 

TTCGTwATTT GAACACTTTG GATAATGATG aaTATGtTGT TCaAAAAATG AAAGAGCCGC 420 

aAATTGaGAA ATCGCA 436 

(2) INFORMATION FOR SEQ ID NO: 565: 

(i) SEQUENCE CHARACTERISTICS:- 

(A) LENGTH: 2554 base pairs 

55 
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iC) STRANDEDNESS : doilble 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 555: 

ATGTTTTGTC AATATCAATT GTTTGAGATA AATCCGCTTG TATAAAACGA ACTTTATCAT 60 

10 CATTAAATTT GCTAGTTAAT TCATTTATAT CAGTACGATA ATATTGCACA TAAACTTCAA 120 

ATCCATCAGT TAATAATTGT TTGACTATCT CAGAACCAAT TGAACCAGAA CCACCTAATA 180 

CTAATGCTTT CATTACTTTT TAATCTCCAA ACGACTATCG ACTTGCTGAT CTAAATTTAA 240 

ATATAACGAT GACGTTTCGT TAATACTATC TAACGTGATA TTTTCAACAA TGTCTAACAT 300 

GTCAAACACG CTAACACCTT CAAAATACAA TTTAGTATAT TGATTAGCAA TATATTCAGG 360 

TGAGTTTAAA CTTGATATGA ATTCACCTAT AAATTGCTTT TTCAAAAGTT CAAATGCTTC 420 

TGCATCTTGG AAAtTGCCTT TTTTATCACG CAACTCATCT AATAATAATT TTTTTAATTT 480 

ATCTGGTTCT TCAGTAGCAC TTGTCACGAT TGAAAAACTA TACGTCGGCT CTAGTACAAA 540 

TTGATAACCA AATGTATCAT CGATAAGTCC TTCGTTTAAT AAATTCTGAT AAAAATCTGT 600 

TTCTTCCCCA AAAATTAACT CAAAGAATAA TGACATTTCT AAATCACGTT GTACATATTT 660 

TTGAGGCGCT TCTTGTAATG GTTTAnTTT AT^CCAAGC ATTAGTCTTG GTGATTGAAT 720 

30 TTTCATAGAT TCAGTAACAA ATGCTTCTTT AACATCcTCC GGTTCATCAA CAAGTCCTCG 780 

TTCGATTTTG GGTTGGTTAA CTTTATTACG AGCATCCTCG TGTTGTTTTA CTATTCgACA 840 

TATTGCTTCA GGATCCACAT CGCCAACAAC AAATAAAACC ATATTTGATG GATGATAAAA 900 

35 CGTTTCATAA CATAGATACA AATCATCTTT TGTAATATCG TATATACTTT CTACACTACC 960 

GGCAATATCA ACACGTATTG GATGTTGTTG ATACATTGCA CGCAAtGTAT TaAACATTAA 1020 

TTTATATCCA GGTTGCTCTT GaTACATTTT TATTTCTTCT GCAATAATAC CTTTTTCTTT 1080 

ATCAACAGTT TCTTTTGTAA AATAAGGCGT TTCaACCATT GTAAGTAAAC GTTTAATGTT 1140 

GTTTTCAATA TtATCAGTTG CACTGAACAA GTAGCTTGTA CGATCAAAGC TTGtAAACGC 1200 

ATTTGCTTGT GCGTTATCTT CAGCAAACGC AGTAAATAAG cTTCTTCTTC TTTTTCAAAT 1260 

AATTTATGTT CcTAAAAAGT GAGCAACTCC ATCAGGTACA GTAACAAATT GGTCTTGTCC 1320 

AAGGGGTTTG AATTGATTAT CTAATGAACC AAATTGTGTA GTGTAAGTGA CAAATGTCTT 1380 

SO TTGAAAACCT GGlTkGGGGA TAATAAATAA TCGTAAACCA TTTTCTAATt CTTGTTCGAA 1440 

tACTCTTTCG TCTATTAATT CATAATAACG CTCTTTCATT ATTTATCCCC TCCTTTTGTC 1500 

AACACATAGA TtGTATCTAA AAATGCTTTT TCAGCAACAG AAACAATATC TTCGCGACTT 1560 
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TTATGCATAA 


TCTCTATAAT 


ACTTTTCGGA 


CGATCTTCAG 


ATTCATATCG 


ATGAGAAATG 


1680 


ATTACTTTTT 


TAGCTAACTC 


TAATTTTTCT 


TCAGTGAAAT 


CTCCTGCTTT 


TATTTTTTCA 


1740 


AATTCACTTA 


TAATAGTGTC 


TTTTGCAGTT 


TCGTACTTAT 


CACTTGAAAC 


CCCACTCAAA 


1800 


ACAAATAAAT 


AGCCATTTTT 


GCCATCAATT 


TGTGAATGTA 


TAGAGTACGC 


TAAACTTTGC 


1860 


TTTTCTCGCA 


CTTCATTAAA 


TAAAACAGAT 


GAAGGATCTC 


CTCCAAACAT 


CATGTTAAAT 


1920 


ACAACAAAGG 


CAGCATATCC 


ACTTTGTCCA 


TATTGTGTTG 


GAAAACGGTA 


TCCCATATTT 


1980 


AATTTAGCTT 


GATCCACGTC 


ATCATATTCA 


ACAATATAAT 


CAACTTCTTC 


ATCGTGTAAA 


2040 


TGATGAGTAG 


AATG7TGGAA 


TTGATGTTTA 


TCGAATGGTT 


TAAGTGCAAA 


TTTTTCACGT 


2100 


ATTTGTTTCT 


CAACACTTTC 


AGGTTCTACA 


TTGCCGACAA CATAAACAGA ACATTGATCA 


2160 


TTATTAATCA 


TTGATTGATA 


TGTATGATAT 


AGTGTTTCAG 


CAGTAATATG 


TGGGATTTGT 


2220 


TCTAGTTGTC 


CTGTAGATAA 


GTATTTATAT 


GCTTCATTTT 


CAAACATATG 


GTCGAGTAAT 


2280 


TTTAAAAACG 


AATATTGTGC 


TTTATTATCT 


ACCATTGCTT 


CTATTTTTTT 


GGCTAATAAT 


2340 


GTTTTCTCTT 


GGTTAACAAA 


ATTATCATTG 


AATGCTTTAT 


TTTCAATTAA 


TGGATTCCAA 


2400 


ATGATTTCTT 


GtAATAAATC 


TAATCCTTGa 


TTAAATAATG AwTCACCGkT TCyTAAATAA 


2460 


CGkkCaTTAA 


caATTyCTAA 


tGaAAATGtA 


ATgACaXGCT GaTCTTTGAA TTTTGAAATI 


2520 


GTACTATTCA 


CATACGCACC 


ATATAAATCG 


GCTA 






2554 



(2) INFORMATION FOR SEQ ID NO: 566: 



(i) SEQUENCE CHARACTES^ISTICS : 

(A) LENGTH: 1424 base pairs 
^5 (B) TYPE: nucleic acid 

(C) STRANDEDNESS r doiable 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 566: 



TnTCGCTATT TTnAATTGGT 


TTTGTATGGT 


TTAAGTTATA TCAATATACA ACAnACCCTA 


60 


AAGCTGATAT CCCAGGTATC 


ATTTTTAGTA 


CGATTGGTTT 


TGGTGCTTTG 


TTATATGGTT 


120 


TCTCAGAAGC TGGCAACAAA 


GGTTGGGGTT 


CAGTAGAGAT 


AGAAACAATG 


TTTGCGATTG 


180 


GTATTATCTT TATTATTCTA 


TTCGTTATTA 


GAGAATTAAG 


AATGAAATCA 


CCAATGTTGA 


240 


ATTTAGAAGT ATTGAAATTC 


CCaACATTTA 


CATTAACAAC 


AATTATTAAT 


ATGGTTGTAA 


300 


TGTTAAGTTT ATATGGTGGT 


ATGATTTTAT 


TACCGATTTA 


TTTACAAAAT 


TTACGCGGAT 


360 


XcTCAGCATT AGATTCCGGA 


TTGTTATTAT 


TACCTGGTTC 


TCTAATTATG 


GGTCTACTAG 


420 
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m 

TTGCTGTAAT GACTTATGCA ACATGGGAAT TAACTAAATT AAATATGGAT ACACCATATA 540 

TGACAATCAT GGGTATCTAT GTACTTCGTT CATTTGGTAT GGCATTTATA ATGATGCCAA 600 

TGGTAACTGC AGCTATTAAT GCGTTACCX3G GACGACTTGC CTCTCATGGT AATGCTTTCT 660 

TAAATACGAT GCGTCAATTA GCAGGCTCTA TAGGTACAGC AATCTTAGTT ACTGTAATGA 720 

CAACACAAAC TACACAACAC TTATCAGCTT TTGGGGAAGA GTTAGATAAA ACGAATCCTG 780 

TTGTACAAGA TCATATGCGT GAATTAGCAT CACAATATGG CGGACAAGAA GGCGCAATGA 840 

AAGTGTTACT ACAATTTGTA AATAAACTAG CAACGGXTGA AGCTATTAAT GATGCATTTA 900 

IS TAGTTGCAAC GATATTTAGC ATCATCGCCT TAATTTTATG TTTATTTTTA CAAAGTAATA 960 

AAAAAGCAAA AGCTACAGCT CAAAAGTTAG ATGCAGATAA TAGTATCAAT CATGAATAAA 1020 

TAAAATAAAT TAATTGAAGT GTGACTAATC AAAAATTATG TTGTGGGGAC ATGATTTTTA 1080 

AAGTATCGGT GCCAAATATG GTTATCGATA CTTTTTTTAT TTGTTGATTT ATAGAATGTT 1140 

AGAGGAATTA TATTAAAATT TGGCATTGAC GTAGTAGGTC ATTAATAAAG AAAAAGCAGG . 1200 

AAGTGGGTCA ACGAAATGAA TTTTGTGAAA ATAACATTTC TGTCCCAATC CCTACTATAT 1260 

AACATTATTT TAAACGAGGC ATGCGATTAC GGAAGAATAA GCTTATAACA AGTAAACCGA 1320 
TGCTACAGCC AAGTAAAATG ATGCCGTTAT GAATAGCGTC ACTTgCTGTA ATCACTTGAT ' 1380 

CTGGTGGTAC ATTTAAATAA TATTTTTTGA AAACATCTGC AATT 1424 
(2) INFORMATION FOR SSQ ID NO: 567: 



20 



25 



30 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 676 base pairs 
35 (B) TYPE: nucleic acid 

(C) STRANDEDNBSS : double 

(D) TOPOLOGY: linear 



45 



40 

Ui) SEQUENCE DESCRIPTION: SEQ ID NO: 567: 
TCTCCCATGT TCTGCTAAAT GACGCATCAC TTTTACTTCA TGAGGCGTCA ATACACGTCC 60 
TTCACCAGCA TTCAAACCGA CAACATTTAA AGGCCCATAT TCAATACGAG ACAGTTTCGT 120 
CACTTGATGA CCAAAATGTT CGAACATTCT TCTGACTTGG CGATTACGAC CTTCTGTAAT 180 
TGTAATTTCA ACCAATGTTG TGTTTTTATC TTTATCTTGT TTCTTAACTT TCACTTCAGC 240 

« 

SO CGGTTGCGTC ATACCATCTT CTAATTCAAT ACCTTTTTCT AGCGCTTTCA CTTCTTCTCT 300 
CATTAAATAA CCTTTTAATT TCGCAACATA TTTTTTCTTA ATTTGATATC TTGGATGTGT 360 
CATTAAATTA GTA?^TTCAC CATCATTTGT GAGTAATAAC AATCCAGAAG TATCATAGTC 420 

55 
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ACGTCCTCTA TCATCAGATA CACTTGTkAT CACTTGAGTT GGkTTATGGA AkAAAATGkA 
AAtTTTGTCT TCTAGTTCTA TTTTAATACC TTCAACTTCA ATCGTATCTG ATGGCTTCAC 
TTTTGTTCCT AATTCAGTGA CAGTCGTACC ATTCACTTTC ACTTTTCCTT CAGAAATTAA 
AGTTTCTGCC TTACGT 

(2) INFORMATION FOR SEQ ID NO: 568: 
(i) SEQUENCE CHARACTERISTICS! 

(A) LENGTH: 454 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 568: 

GAAACGGTTC TACCAAAAAA CAGTAAGGGC TAAACCCAAT CATGGTAAGA CAAAAAGTAC 

AAATAGCCAT GCCCAAGTTG AACTCGCTGT ACGCCTATTT CTTTCTAAAA AGATAATAAT. 

AAAAGCCAAT ACTAAATTAA TGATGAATCC AATGGCTAAA ATAATAGTAA ATAACGTTCC 

TAAATCGTTT GAAAATGTAA ATCGCATAGT CTTTTCTCCT ATAAAGAAAG GCACAAAAAA 

ACATTTTGCA CCTTTCACGT CATATTATTT ATTCACAGAT AAAGTTAAAA TTGcATTGAA 

TTCTTCTTCA TTATTTGGGA ATGTTCTTTC TTCTATTTCT TTAATAGTAA TATTTACTAA 

TTTTAAATTT GTAGCTTCTT CAGAACTTAA AAAAGCATTA ATGTTTTTTT CTAATAACTC 

kAAAGTCTCA GCTGtAAAaG TTTTAAGTTT AATT 

(2) INFORMATION FOR SEQ ID NO: 569: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 894 base pairs 
. (B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 569: 
ACGATATTAC CACCCTCTGA AATAACATCA ATCATGTGAT CTGTAAAGTC CCAAGGATGA 
CTTGTTGTGA AACGAACTCT TGGAATCGCT ATTTTAGAAA TTGCTTGTAA AAGATCTCCT 
AAGTCATATT CTATATCCTG TAAATCTTTA CCATAAGAAT TTACATTTTG ACCTAAAAGC 
GTTATTTCTT TGTAACCTTC ACGAGCAAGT TCACGTACTT CATCTATAAT GTCTTCAGGT 
CTACGGCTTC GTTCTTTACC TCTTGTAAAT GGAACAATAC AATATGTACA AAACTTATCA 
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TCAATAACGT CTCCTTCTTT AGACCATACT 
TCTTCTAAAA TTTCTGGTAA ATGATGAATA 
TGATACGATT TTAAAATTTT ATTCACTACT 
CCGATTAAAA TATCAGGTCG TTCTTTTTTC 
ACTTTGTTCT CGGCATTTTC TCTAATCGCA 
TTAATATCAG TCGTkGCrXG aTAGCCTAAT 
TCATGTGCAT TCATTTGACA TCCATATGTT 
CCGCGATATT TTyCATCAAT TtGGgAAATC 
TTTTTTilCGC TCCTTTAAAA TTAAGGCGGC 



TCAACAACCA TTGCTTTAGA TAAGTATGCT 
TTATGTGTAC CAAATATCAT ATCTACATTT 
GACTCTTCTT GTGACATACA ACCACAAACA 
AAATrCTTCA AATTACCTAT TTCACTAAAC 
CATGTATTAA TTAAAATAAC ATCTGCAGTG 
GCyTCmAGTA TACCAGCAAT GACCTCAGTG 
TTAATTAAAA ATGTACGCTC GTTCCCCATA 
nCTATTATAA CGAACTTCTk GTtTACCnCC 
TGATAAACAG GTCCAAAATA TTAC 



(2) INFORMATION FOR SEQ ID NO: 570: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 441 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 570: 
TATCAATCCC ACAGCACATG CTGAACAAGA TCAAACATGG GAGAAGATTA AAGAACGCGG 
TGAACTTAGA GTGGGTCTTT CTGCAGATTA TGCACCAATG GAATTTGAGC ATACAGTTAA 
TGGTAAGACT GAGTATGCAG GTGTAGATAT TGATTTAGCT AAAAAAATTG CGAAAGATAA 
TAATTTAAAA TTAAAAATCG TCAATATGTC ATTTGATAGT TTGTTAGGAG CTCTTAAAAC 
TGGAAAAATT GATATTATTA TTTCCGGAAT GACTTCAACG CCTGAACGTA AGAAGCAAGT 
TGATTTTTCA GATTCATATA TGATGACTAA AAATATCATG CTTGTAAAGA AAGATAAAGT 
TAATGAATAT AAAGATATCm AAGACTTTAA TAATAAAanA GTnGGGGCAC AAAGGGACTG 
AACCAGAAAA AATCGCTCAA C 
(2) INFORMATION FOR SEQ ID NO: 571: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1205 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 571: 
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AAGTCGTTCA TCTTTTTCTA CAAGGGTGTA AAAATAATCA ATCATATCGT ATAACGCTTC 120 

TTTACCAATG ATGTCATATG GTGTTGTTGT CATTTAATCA CCCATTTTCA AAAATTTACT 180 

GTTACGAACT TAAGTTAATA TATAACTAAT ATAACATGAT TTTAAACATT TGAAAGAAAT 240 

ATGCATATTT GCCAATTTAA TTTATATTGT TTGAAAGTGT TTCTTTTTTC TTGAAAAAAC 300 

GTTGAACTTT ATTTAAAGGT tGATGATGTT CGAGGTTTAG TTCGTTtAAT AAAGATtGGA 360 

ACTTTTGTAA ACCTTGATTA TAGTCTTTAA CTTCGAACTC TAACTCATAA TCCGTAGTAT 420 

CGAAATACTC ACTTTTATCT AAAACCAGTA AATCACCTTT ATATTTAGTT TCTTGGCGAT 480 

75 ATGTCGTTAA TGCACCAAGT ATTGATAAAG TTGTATCTTT TACACCAAAC TGTTCAACTA 540 

TAATTTGACG AATGTCATCT GGAAGATTGT CGTTTGAAAT AATCAAGTTC ATCTCTGGTT 600 

TAATGTCGAC GATATAGTTG TATTCTAATA GACCAACCTT TGCTGGTGTC TTTAAAGTCA 660 

TTTCATATTG ATTGTCTTTA ACTCTTATGC GTAGTGCAGA GCGATGTTCC TTTAATTTGA 720 

AATCGGGTGT ATCAATATAG TAATTGACTT GCTTAmAAAG CACACTGTCT TTAAAATATT 780 

TCTCTTGCAA TTTATTATAG ATTGAtGCAG TTATCATTTG TtTAAATTCT ATtTCATGAT 840 

TTGTTGCCAT GATATGTATA CACCTCGTAT CAAATTCAAT TTATCTTAAC TATATTATGA 900 

ATGACAAAGT TGAATTTTAA AAGTAATTTC CTTTATCTAT TATCAATGTT AATTTGACCA 960 

TTAAAAATAG TGTTCGTAAG TGTTTTGTAT TATTGaATTG TGTTAAAATG TTATGGAATA 1020 

AGAGGAGGAT TAAGCATGsG TTTwTATATT AATGAAATTA AAATTAAAGA TGACATACTT 1030 

TATTGTTATA CAGAAGATTC TATTAAAGGA TTATCTGAAG TAGGACAAAT GCTCGTTGAT 1140 

AGTGATAATT ATGCCTTTGC GTATACATTA GATGATGGTA AAGCGTATGC TTATCTCATT 1200 
TTCGT 

(2) INFORMATION FOR SEQ ID NO: 572: 



20 
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30 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 570 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



1205 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 572: 
5^ TGAAGAAATA GCAATGATGA AATGCCGTAT GTTATATGAG ACGGGGTCAT TTCTTGAATT 60 
AAGAGAAGAA ACAATTGTCT TATTGAAAAC TGGCATACAA CAATATGATG CATTGATGAT 120 
TTATTACGTG AAAAGTTTGA TTGGTTTGGG ACAATATTTT GAAGCGGTAG AAGTAATTCA 180 

55 
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ATTTGCTAAG TCAAAATTAA TTGAAGATGA AAAACGATTG ACTCAGTCAT TAGCTGATTT 
TGrTACGTTA TCAATGAGGG AACAGACGCA CTTGATTTTG AAGTTAATAG ACAATGGTCA 
TTTTCAATTT CAAGAAACGG TATTATATAT ATkAAaAyCT AATaCXSTACa GTtATAACCT 
CATTAGTTTA ATGATTGAGT ATTTAAGGTT CGCAAATTGT ACACAAGAAC TGACAATTGA 
AAAGTATGGT ATGGATGTAA CTTTTGTACC AGCTAATTTA AAAGGGCTAG AACATACAAC 
ACTTAAAGAA AAAGTTATAC CTAACGTTAT 
(2) INFORMATION FOR SEQ ID NO: 573: 
(i) S2QUENCE CHARACTERISTICS: 

(A) LENGTH: 939 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE. DESCRIPTION: SEQ ID. NO: 573: 
GTTGAATGGT TAGCAGCTGC AGTTGTATTA TATTTCTGTG GTGTAATTGT TGACGCTCAT 
GTATCATTCA TGTCCTTTAT TGCAATATTT ATCATTGCTG CATTATCAGG TTTAGTCAGC 
TTTATTCCTG GTGGTTTCGG CGCTTTCGAT TTAGTTGTAT TACTAGGATT TAAAACTTTA 
GGTGTCCCTG AGGAAAAAGT ATTATTAATG CTACTTCTAT ATCGTTTTGC GTACTATTTT 
GTACCGGTAA TTATTGCATT AATTTTATCA TCATTTGAAT TTGGTACATC AGCTAAGAAG 
TACATTGAGG GATCTAAATA CTTTATTCCT GCTAAAGATG TTACGTCATT TTTAATGTCT 
TATCAAAAGG ATATTATTGC TAAAATTCCA TCATTATCAT TAGCAATTTT AGTATTCTTT 
ACAAGTATGA TCTTTTTTGT AAATAACTTA ACGATTGTkT ACGATGCTTT tATATGATGG 
AAATCACTTA ACGTATTATA TTCTATtGGC AATTCATACT AGTGCTTGTT TATTACTTTT 
ACTGAATGTA GTTGGTATTT ATAAGCAAAG TAGACGTGCC ATTATCTTTG CTATGATTTC 
AATTTTATTA ATCACAGTGG CGACATTCTT CACTTACGCT TCATATATTT TAATAACATG 
GTTAGCTATT ATTTTTGTTC TGCTTATTGT AGCTTTCCGT AGAGCGAATA GGTTGAAACG 
CCCAGTAAGA ATGAGAAATA TAGTTGCAAT GCTTTTATTC AGTTTATTTA TTTTATATGT 
TAACCATATA TTTaTTGCTG GAACGTTATA TGCATTAGAT ATTTATACGA TTGAAATGCA 
TACATCTGTA TTGCGCTATT ACTTCTGGCT TACGATTTTA ATCATCGCTA TCATCATAGG 
TATGATTGCA TGGTTGTTTG ATTATCAATT TAGCAAAGT 
(2) INFORMATION FOR SEQ ID NO: 574: 
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(A) LENGTH: 1059 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOIiOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 574: 
GAATTAATTA AATATTACAC ACAGCCTCAT TTTTCATTTT CAAATAAATG GCTATATCAA 
TATGATAATG GAAACATTTA TGTTGAACTT AnGAGATATT CATGGTCAGC ACATATATCT 
TTATGGGGCG CTGAAaGTyG GGGAAATATT AATCAGTTAA AAGATCGTTA CGTAGATGTG 
TTTGGACTAA AAGACAAAGA TACTGATCAG TTATGGTGGT CTTATAGAGA GACATTTACA 
GGTGGCGTTA CACCAGCCGC AAAACCTTCT GATAAAACTT ATAATCTTTT TGTGCAATAC 
AAAGATAAAC TACAAACGAT TATTGGTGCG CATAAAATAT ACCAAGGCAA TAAACCAGTA 
TTAACATTGA AAGAAATCGA TTTCCGTGCA CGAGAAGCGT TAATAAAAAA TAAAATATTA 
TATAACGAAA ATCGTAATAA AGGTAAGCTT AAGATCACCG GTGGCGGTAA TAACTACACT 
ATTGATTTAA GCAAAAGATT ACATTCAGAT CTAGCAAATG TTTATGTTAA AAATCCTAAT 
AAAATAACTG TTGACGTCCT CTTTGATTAG TATATGAAGG TGACTTATAC TTCATGCACT 
TTAATTCCAA ATCAGATTAT TTAAATGATA ATTTTTAAAG TGTATGATGT ATATAATAGG 
TAAAATTTTC TATATATTTA AATGGAATTG GGAGTAGGAA TGTGACAGAA ATAGTATTTT 
ATAAAATTTA TTCtTGTCAC TCCCCAACTT GCACATTATT GTAAGCTGAC TTTCCGCCAG 
CTTCTATGTT GGGGCCCCGC CAACTTGCAT TGTCTGTAGA aTTTCTTTTT GAAATTCTCT 
ATGTTGGGGC CCCGCCTATA ATTGAAAAAT GCTTGTTACA TGGGCATTTT CATTCGGTCA 
ACTACTACCA ATATAATATT GtAGaGCCTA AGACATTGAT TTATTATGTC TTAGGCTCTA 
TTCCTTCATT TAATGATTAA nTTATTATAG CAATACTTTA TTGTCCCATG ATTAGTGTTC 
TTTTAATGAG ACATAGTAAC TATAAAGTTT AATAATCGT 
(2) INFORMATION FOR SEQ ID NO: 575: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 574 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 575: 
GTTTGCTTTA GGTCCTGTTT CATATTTATA CTTCGAAGGA TTTACCTTTT TGaAGTCTGG 
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TTCAACTkGC TTTTTAITCT TTTCGAAATC AGCTGGTTGA GTAGTTATGA GTTCATTATT 
TTTATTAGmA TAAATCTTAC CATTAACATA TTTATAATCT TTTGTTATAA AGTCACCATT 
TCTGAATGGA ACTACTTXjAT TATGACCTTT AGAGAATAAA TCAGTACCXiA ACATTAAATA 
GTTCTTCGTA TCTATACCAG CCAAATGTAA AATTGTTGGC ATTACATCGA CTTGACCAGC 
ATATTCATTA TTGATACCAC CAGATTTACC AGGGATTTTA ATCCAGAAAC CAGTTCTGTT 
TAAATCTGTA AATTTAGCCG GTGTGATTTT TTCACCTAAT AGTTTTTCCA TGGCATTGTT 
ATGGTTTTCA GAGATACCAT AGTGGTCACC ATAAATCATA ATCACTGAAT TGTCATATAA 
TCCTTTTTTC TTCAAGTCAT TAATATATTC TTCT 
(2} INFORMATION FOR SEQ ID NO: 576: 

(i> SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 796 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

• (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 576: 
CAATGTTTTA TAGTACAATA TATTTTtlAAT AATACTCGTT AAGGAGAATG ATATGATATC 
AATTCACGCA ATTTCGACAG GAAAAATCCA AGATTTGCCT TATAGCTCGA AAAGACCGAT 
GCGCTCTGCT TTAGATAAAA CTAAGATTTC ACAAACAACA TGGTTATCTT CAACTGGTTT 
CACTGGTGAT GAACAGGCTT ATAAAGATCA TGGTGGACCA CATAAAGCAG TTTGTGGGTT 
TAGTAAGCAT AATTATGCAC TGTATCAAGA TGATTTACCT ACACTACCTA CTCATGCGAT 
GTTTGGAGAG AATTTAACAT TTGATTATTT AGACGAATCT GATGTTTACT TTGGTAATCA 
ATATCGTTTA GGTGAAGCGT TAATTGAGGT TTCTGAAATT AGAGAACCAT ACTGGAAAAT 
TCAAGCAAAA TATAATATTC CTGATTTAGT GAAGCGCATG TCTACATCTG GTAAAACAGG 
TTTCTATTTC CGGGTATTAA AACAAGGCTA TGTATCTCCA AATGATCAGC TTTACTTAAT 
ACAAGAAGCA CCAATCGAAC ATCGTTTATC TGTACAACAG CTTAATGACC TTTATTATAA 
TGATAGACAA AATCAAGaTA TGTTACGATA TGCACTAAAC AATCCATTTC TGTCACCAAC 
AAGACGCGAT AAACTTCAAA AAATGTATAA CAGAACATTG GAAATAATTA CCTTTCATTn 
ATAAGTGTTA AATGAACTTT TCAAAACAnA AAGGAATCAA CTTCACACAT CGTTTGTATG 
AATAGTCTTA TCTATA 

(2) INFORMATION FOR SEQ ID NO: 577: 
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(A) LENGTH: 1095 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY 1 linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 577: 
AGAAATTATG ACAAAATATA AAGATGGAAA GTTAGTTTAT GCATCAGTCG AACCAGGATC 
TTACGTAATA CATAAAGATG ATGCAATTAA ATATGACGAT TATTCTAAGT TAAAAAAATT 
AAGTCAGCTA ACTAAACTTG ATCATCCAAA ACCAGTTCCA TATAGCGTaC TCAAATCAAA 
TCTTTCGGAG TACCTTTAAC AAGCGTTTCA TTTATGACAC ATGGATCAAA GGATACTAAA 
GATGAAGTGT TGCCGGCATT GGCCTATTTC ACTTTTTCAC CAAAAAATTA TGAAGACAAG 
TCTAATCCAG ATCCAAAAGT TTTAAATTTA GTACATATGG ATTTCTTAAA TGCATCTAGT 
GATTTTGGTA ACGCACATTT TGTTGTTTTA AGTAAATATA TTAAAGAGTA TGAATCAAAC 
TATGAAACAG CGTCAGATGA TTCTTTAAAA TAGTATTTAC TGTGTGAAAA ATAAATAGTG 
TACTACATTA AATAATCGCA ATAATAATCC CGATAAACAA TCAGCATTAC TGCTTATCAC 
ATAGAGTTCG TAATAACTAT AACTCTATGA TTCGCAAATA ATAAATGATT GTCATCGGGA 
TTTATTTTTA TCAATTTATA AAGTGACATT ACCTTGTTCA TCAGCAGGTT TGAAAACAGT 
AATCACTGCA CTAATAATTG CTAAAATGTG TGGGATACCT GTCCAACAGA ATATTAAGTG 
TAGAATACCT TGCATATTCT TGCCGGCATA AAATTTATGA ATACCAAAAC TACCTAAGAA 
CAATGCTAAT AAAATATAAA TAACTTTGTT TACTTGCATT TCTTTCCCTC CAGTTGAATT 
GCTTATAATG ACATTAGCTT CTCTTTTTAT TATACCCACT TTTAGTTCAA ACATTCTAGT 
TTAAGCATTC CCAATCATCT AAATTTCAGT TATTCAATCC TTACAATAAA TTTAGGATTA 
CATTTCAGTT GCATTGTATT ATTTTACGTG TGAAATATAC GTAATGAATC ACATGACAAy 
CTyCAAATTG AAAAATATAC ATTCTATGAT GTAAGGTCGC ATTTTTAATA TATTTACGTn 
AAAATAGTTT GGATG 

(2) INFORMATION FOR SEQ ID NO: 578: 
(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4 89 base. pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 
<D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 578: 
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ACTGCCAAAA TAATCATAGC CATGTTCTAC AGCTGCTTTC GCTACAATAT CCAAACGCAT 
TTCAAAACAA GCGGTACAAC GTAAGCCGCC TTCTTTTTCA TCAGCTAATT CTTTATCCTT 
CACCATTTTC ACAAACTTAT GTGGTTCATA AGGTGCTTCA ATATACTTCA CATTCGCACC 
AGTCTTGCX5A TTAAAATCTT CCACAAATTG TTCTTGCACT TTAGCACGTC GTAAGTACTC 
ATTTTTCGGA TGAATATTTG AATTCGCGAA ATAAATTGCA ATGTCTGCAT ATTGTGTTAA 
AAACTCTAAT GTATATGTAC TACAAGGTGC ACAACAACTA TGCAATAAGa TTTTAGGTCT 
GATTGCTTCT CTTTCCCACT GsCCGATTAA TxiTCTTCAAC ACCTTGTCCA TAATTAATTT 
GTnGATTTn 

(2) INFORMATION' FOR SEQ ID NO: 579: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1287 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 579: 
CGTACTGCAT CATTTGTTGA AAAATTTGCA AACTTCTTCA AGATGTTATG GCTTAGACTT 
AAAGCGATGA AGCACTACAA AGCCTTAAAT AAAGAATCTA AGAAGCAAGA ATTTGAAAAT 
TCATTCAAAG ATGTTCAAAA AATTATGCGT ATTGTGAATC ACAATATTAT TTTACGCTTA 
AAAGAAGAAC AAAATAGTAC AAATGTACTT GAGGTTAGCT TAGTCATTAA TCATTACTAT 
GATATGAGTC GCTCATTAAA GTGGCGTGCA CAACGTCGAA AAGAACGTCA AGAAAACAGC 
AATCAAATCA TACCGCAAGC TATGTTCCAT AACCACAAAT TGGAAGCATT GTACTTACAA 
CGTCATCTTT TAGATGAATT AATTCGCAAA AATAAAATCA ACAATATCGT TGCAGCTCAA 
ATTCGAGAAA ATATCAATTa CAACGAAATT GTCTTGTCTT TACAGTCCAA ACATTclAGCA 
AGaCwTaCaw TmCCCCCGTA CATATGAGAC AAAGTCATTA TCATCTCATA TGTACGGGGT 
TTTTATATTC AACATCAAAA AATCAGATTG ATGAAAAGTA AATAACCTTT CATCAATCCG 
ATTTGATTAT AGAATCTATT TTTTAAGTTT AAATGGAATT GTACATACGT TAACATTCTT 
TTGATAAATT AAATACAATT TCATACGCAA ACTAGTTTGA TTGTGTAATA AATTATGCCA 
ACGTTTCTTA GTAATAAATT CTGGTATCAC TACTGTAATC ATATAGTTTT GATCGTTGGC 
TTTACGATTA ATCTTATCGA TAAAACGTGA AATTGGTCGT ATAATACTGC GATATTCCGA 
ATGTAAAATA ACTAATCTTA CATCTGGGAA ATGACGTTTC CATTTCTCTT GGAATGCTTT 
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TGCGTAATAA ATAGACTTAT CAACTGCTGT TGTAATACTT GTTATCGGCA CAATTGCTAA 1020 

ATTACGATCT ACCACGTCCA CATTAAGAAC ATCAATGTCA GAACGTAATT GTTCTGCGAT 1080 

ATCTCGATAA TGkTTGkTAA TTTTCAAQAA GAAAATCACC ACGAACGGCA AGAAAATAAG 1140 

TATCGGCCAT ACTTGGCTAA ATTTAGTTAT GAGTAAAATC cATAAnAACA ATAAATGTCA 1200 

CGATACCACC AAGTAAGTTC ACAGACAACT TACTTAACCA ATTCTTAGGA CGTTCATGAA 1260 

TCCATTTAAT AACCATACCG AATTGTG 1287 
(2) INFORMATION FOR SEQ ID NO: 580: 
,5 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1223 base pairs 
<B) TYPE: nucleic acid 

(C) STRANDEDNESS : doiible 

(D) TOPOIiOGY: linear 

20 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO; 580: , 

GCCTCCTTTC CTATATCCAT GGGTGTCCTA GTTGGGAATG GCTTATTCCC TATCCCAAAC 60 

ATCTGTCAAT TCAAGACTAT CACTGTATAC TAAATCGCCT nTCTATACnT CCATHCATTT 120 

CATTTTCCAG TTGGAACAAT TTGTTTAATT ATTTTAAATA TCATTATCAA TCCAGAAGTA 180 

TTTACTATTC ACTTTTACAA TAATCAATCA TTTAACTACA CATGGGTAGT CGGTGGTTTG 240 

CTTGGGGTTA GCTTTTTAAC TGGCAATTTA TTGTTATTGC CAAAATTAGG TGCAACATTA 300 

ACTGTAATTG CAACAGTTGC GGGTCAAATT ATTATGGGTG TCATTATTGA TACATTTGGA 360 

35 TTATTTGGCG CTACAATTCA TGATTTTAAT TTAATTAAAG CAATTGGAGT ATTGTTACTC 420 

ATTGTCGGCA TCGTCATAAT GAATCAATTT AACAAGAATA ATTTATTACT AACTGATCAA 480 

AAGTATTTAC TGTTTTGGCT TCTATTAGGA TTTATTTTTG G TTT C TTTCC ACCTATTCAA 540 

ACGACAATTA ATAGTGCTTT AGCTAGTCAT ACTCATTCAC CAGCCTITGC ATCATTAGTA 600 

TCATTTACAA TTGGGTCAAT AGCGCTATTG ATTTTAACCG CTATTTTTAA TCGTTCTTTA 660 

AAACTAAAAA CAAGTCATTT AAAATTCGGT AAATTAAAGC CTATCTATTT TACTGGCGGT 720 

ATACTTGGCA TGGCTTTTGT AACAGCTAAC ATTATCTTAA TGCCTCATAT GGGTGCAGCA 780 

-TTAACAACAC TTATTGGGAT GTTTGGCCAG ATTCTAATGG GCATATTGAT AGATCACTTT 840 

GGATTATTTG GTTCACCTAA AATAGCAATG ACATCCAGAA AAACTATTGG TCTATTATGT 900 

ATTTTGACAG GCATTATACT TTTAAGATTA TTTTAAATTA ACTTTTAGCT TATCATTTTA 960 

ACTTGTAATT ATTTTTAAAA GTGATAAGCT ATTTTTTTGT GGTCTAAAAA TCTTTAGAAA 1020 

55 
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CAACTCATTC TTAAGACCTA AATTAATGTT ATnTTTTAAT AATTTACACC AAATTAATAG 1140 

CAAAAATTAT GTTATTCGTG CTAATATTTC ATAGTTGGTT ATTCAATTAA TTAAAAATAA 1200 

^ GTCAAAATGC ACAACTTTTT ATn 1223 

(2) INFORMATION FOR SEQ ID NO: 531: 

(i) SEQUENCE CHARACTERISTICS: 
10 (A) LENGTH: 454 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDE0NES5 : double 

(D) TOPOLOGY: linear 



1$ 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 581: 

CACCTTTTTA TCATGCTTAG TTATCAATAA ATCTATATTT TGCTGTTTTA CAATTTTTTT 60 

20 AACTTTATCA ATCTCATTAT CTTGGACTAA ATAAATATAT GATCTTGCAT CTGTTGCTAG 120 

AGCTTGTTCG TGTTTTTCTG ATAAAACATA TGTGATGGAA GCGTGAATAA TAATGCCTAA 180 

TGTAACAAAA CTGATAATTA ATATACTGCT TATCAATAAC ATTAAGCGGT GGTGAAACTT 240 

CATCATTGTT CTTTAGGTCT TTCCAATTTA TAGCCTAAGC CACGCACAGT TTTAATAAGT 300 

TGTGGCTTCT TAGGATTATC TTCTAATTTA TCTCTTAAAT GACTGATATG TACATCAACA 360 

ATTCTTGAGT CTCCTGCAAA TTCATAATTC CATACCGTAT TTAACATATG CTCTCTCGTA 420 

30 

ATGACTCTGC CTTGTCTTTC TATCAAATAA AGCA 454 
(2) INFORMATION FOR SEQ ID NO: 582: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 452 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

40 

(xi) - SEQUENCE DESCRIPTION: SEQ ID NO: 582: 
TTTATAAGAT TTTATTTACA AATAATTGGT TTTCATATGT ATAAACACTT TTGACTTTCA 60 

45 

AATCTTAACG ATAATTCTAT TACAATACAA TCCCCTATTA GAATGATTTA TGTAATAAAA 120 
AAAGCGGAGT TTCCCCCAGC TTTTCTAAAC GACTACATAA AATATAAGAT TGCAATTAAA 180 
TGCAATAGTG ATGCTATTAC AATAAAAAXA TGCCAAATCA TATGAAAATA TGGTCTATTC 240 

50 

TTTTGTGCAT AAAACCATGC ACCAATTGTA TAAGACACAC CACCTAAGAA AATGAATAAT 300 
ATGAATATCC ATGATGTGCG AATAAAAATA ATTGGTAACA AGATAATACC TACCCAGCCC 360 
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AAAATCCCCC AAAGTGTCGT TCCCCATAAT AA 452 
(2) INFORMATION FOR SEQ ID NO: 583: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1472 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

<D} TOPOWGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 583: 

CGCTTTTTGC AATAAGTCAT TAGCCGCTTT TAAGCCTTCT TCTTTTCGAT CTACAACAAG 60 

TAAAATAAAT GGCTTTAACG CTTCTTCTTT TTCACTTTCA AGCATATCTG GTTTTTGAAC 120 

CATTTCAAAT GGAGATTTCA ATCCATTATT ATCGCTCATT TCAATAATTG CATCATACTG 180 

20 TGCTTGTGAC ATACTTGCAA TAGCCTGTTT TGCATTTTCT T6AAGGAAAT ATAAGTTTTT 240 

CAATTTAGGA TGCTTATTTA ATGTACTTAA TGTAATCGGT GTAATGTCTT TCTCATAAGA 300 

CACTTCAATC ACTGTACTAT TTGTTCTACC AGGAATTGGT GGTTTTTCAT GAATATGCTT 3 60 

TGATACTTCT CCAATTCCAA CGACAGATTG ATTTTTCGTT CGATTATAAA AAATAATATT 420 

GTCGCCTTCT TCTAACTGAG TATAAAAATG ATAACCATTA CGTTTAATAC CGTTGTACGT 480 

GTGCGTATAA ATCGTATATT GGTTTCCAGG TTCAAATTCT TCAGTTTCAG CTAAAAAGAA 540 

ATAACGCGGT ATCTTAATTT CGCCTTTACC AAGACCACTT ATTAAATCAA ACTCTTCTGC 600 

AGTGATTTGA TTGAACAATG TCTCTTTCAT ATtlACTTATA CGAAATTCCA AAGCTTCACT 660 

ACGCTTTAAA TAATCTGCTG TTAATGGTTT CAATTGTTCA TTAAAACGAA ACTGTACACG 720 

TATTTTATTT TGTGCACCTG TTTCAACACT AATAATTTCA CCACATCCAA GTAGTCCAGT 780 

ATCCGTCTGA ACTTGATAAA AGATGACTTG ATCTCCTACT TTAGCCTTTT TAAACGCTCT 840 

40 AAATCCTTGA GATGGGTTAA AATGTGCGCC TGATTCAAAT AAAGCTGTTT GTCCTACTAA 900 

CGGTTCATTA TGATTCCAAC GGTTATATCC ACAATTCAAC CAAAAATAAT TCGTTTCTGC 960 

TGTCATCTTA ATACTCCTTA ACCTGAATAA ATTTTAGAAA CACTATGAAT TACATTCTTT 1020 

tAGTGTTTCT TATGCAGTTG GACGCGTATG CGAACAACTG TATACCCTTT GTTCACTGCG 1030 
ATnTAATCG CATTTCCTAT AACATTGTAG CGCCCAGGAC ATTAATTTAC GTCCCAGACC . 1140 

CTTATCGTTT TCACTTCTAA GTAAGTCGAA CTATTITGCT TTACAACAAG TGCGACTCTA 1200 

AATACAGTTG GACACACATA CGAGCAACTG TATACCTTTT AATCAGTTTT CTATATTTTA 1260 

TTTATTATAT CTGTCTTAAT GATAAAAATT GTTACAAACA GTTTAACATA TTTAGCTACC 1320 
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ATGATACCAC TATGCTTGCci TATCTCTATA GCGCCATTGA TACACATTTT TAAATATCTA 
TACTGCCGTT AGAATTTTAT CATGTCTnAA TT 
(2) INFORMATION FOR SEQ ID NO: 584: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 7 87 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDBDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 584: 
GGTAGTGAAT GGGGTTCAAG ACAACAGTAT TGGAAGTACG AATGAATCAC AGTTTTTAGG 
AAATTATATT GTAATTAAGC ACGCAGAAAA TGAGTATAGC TTAATAGCTC ATTTACACCA 
ATATTCAATC ATTGTGAATG AGGGGCAAAA TGTTAAATAT GGTGATATCA TTGGGAAGGT 
TGGGAATTCT GGCAATTCTA CTGAACCTCA TATACATTTT CAAGTAATGA ATGATAAGAA 
TATTGAAGCA TGTACATCTT TAAAAATTCG ATTTATAAAT AATCGAGAAC TTATCAAAGG 
GGATGTGGTC TGCGGATTAC AAGCTGAATG ATGGCGATAC TTATAAAATC TCGACACTAT 
AAAAATGGTA TAGTGTCGAG ATTTTCTTGC TTATTTAGTT AATTCAAAGT GCACGCCGGA 
TTCATTAGAA GTCGACGTAT TTTTGTTTGT AATAGAGTAA CCGGTCATTG AAATTTTAGA 
TTCAATATCT GAAGCGGAAT TTGTAGATTC AGGATTATAG AAGCTACATT CATAAGTGTT 
ATCATCTTTC TTTTTAAGTA TAAACATACC TTTGGCTTTA ACTTCGACTT TAGTGTTGTT 
AATGTCAAAA GTTTGAGTGC TATTACTATA ATTAACACCA GCCCAAACCG ATTCATTATC 
TTTCACAACG GGGAAGTCAT CTTCTTGCTT AACGACGTnA CTTCATCTTT CTCTGTCTTA 
AAGACATCTT TAGATAAOCC TGGATACAAC ACATATCCAT ATTTATTGTC AGAATTAGAA 
TGCTTTT 

(2) INFORMATION FOR SEQ ID NO: 585: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 830 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 585: 

» 

ATGCTAAATT AGGGGGAATA TTTACGATAA AGAGACCAGA AAAATAATAA AACACATGCT 
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TAAAATGAAG ACTATTTTTT ATTACAAGAA AATGTATCTA GTAAACTTAA AGTAGCAAGA 
CCTAATAAAT TTAATGCATG TTGTGCACCT TTTTTACCTT GGCCAGCTTC GAAATGTTTG 
TAAGCAGCTA CACTTAAAAT GCCTATCGTT GATAGTGATG CAAGGCGAGA AATGTTTTTA 
TTGATAAAGC TAGCTGAGTA TAAAGCAGCA GTAGTTGCTT CTGCAATGCC GACGTATTTT 
ACAAGTTCTT TTTGCAAGCC AAAAGTATGT TCAAACAGTT CAATCATACC CTTATCTTCT 
TGCAATTTAG GTTTACTGGC TTGGTATAGC TCTTTCGCAA GTTTTAAATT CGTTGCGTAA 
CGGAAAATCA TATTTAATTC CTCCCAATAT TTGATTTTTT GTGAAAGATG ATTACTTTAT 
CATTTTTACC CGTTTCTATA AAAATGAATC AATTATGTAA CGTATGTGTA GTTTAGGAAT 
GTTTGCTATG GAAATATAAT TCTGTTCACT CAAAATGTAT GAAATTAATG TGTAGTTTTG 
TCGAGTTGCT CTTTTAATTT GGTTAGATTG TTTTTTAGAG AAGCGGTACT ATTTTTAAGT 
GCATCAACAG ATTTACCTTC GTTTTGAGAC ATTGAGTTTA TTACAGCACG .AAGTTCTGTT 
TCTAGTATGT CaGCGTCGCt TTAGCATTAG AACTTAaTAt TTAtAcTCTT 
(2) INPORMATIOK FOR SEQ ID NO: 586: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 412 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 586: 
TTAGGACGTT TTTACAATCA GTACAATGAG CTCATTGTTA TTAGTCCTTT AACGGCGTCT 
TTTAATGCTG GCGCTACATT TGGGCGATTT CATCATTTAA TTGATACTGA AACTTTAGCA 
AAATTAGAAC ATGAAAAAGG ACATTATTAT CAGAAGATGA TATGTGATGA CAATGTAGAA 
ATGATTTCTA TAAATAACAT ACCGAAATAT CCGAGAAATC ATAATGTATT AACTAATCAT 
GACTCATACG AATATTCATT GAATXTAGGA AGTAGTAATA GXTATTCAAA GTATGAGCTT 
ACCTTAGATG ATATTTATGT TGGTGCTACC TTTtAACAAA TTATATTTAT ATTCTAGCCm 
ACtAAATAAA AGGGkaCtaT TTGaATCaAA CmATaTGtAT TAACCTTTTT TA 
(2) INFORMATION FOR SEQ ID NO: 587: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4709 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 
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(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 587: 

TTCAGTTTGA AATTAATCAT ATAAATTTCT TATGGGAGGG TTGATATCTT AATGATTAAC 60 

ATTATTTCAG CTATAGGATC TATTGGAACA TTTATTATGG CTTTATTTTA TTTTGTATCA 120 

GTTTCAGTTC AACTTTATCA AATGAAAATT AGCTTTCTGC CAGCTTTAGG TTTTAACCAA 180 

« 

ATTTTATTAG AAAGGGAGGA GGATCAACTT AATATAATGA ATTCGGCAAC AGAAGAGCAT 240 

CATCATAAAG ATTATATTAA ACTATATAAT TTAGGTGGCG GTGCTGCTAA rAAAATTGCA 300 

ATAGAGGTTT TATTGGGGAA GGATArAGTC ATTCAGAAAA AATACGTGCA TATTkTACCT 360 

AGTAAAGAAG GGTACATGTT ACCAATTAAT AAAAATGTGT ACGAAGAATT AGAAAGAACG 420 

ATTGASAACA ATGGTCATGA AGCTGATTTG AATGTACGTA TGACTTATTA TCATAATGTA 480 

AGTCGCAAAC AACAGGAAGT TATATTAAAA GGTCAAATCG ACCGTTTTAA TACTTATAAT 540 

20 AATAAAGAAA TTTATGATTT GCAGTTTATC TAAAAATTGA TTTAAGAGGG TAGTTGTTTA 600 

TTGCGAAAAA TATCATTCAA TTTTAATGAA ATAATGGCGT CATTACTATA AAATATTACT 660 

TTATGTTGTA ATGCATTTTT CTATAAGATA GAACTAAAAG GAGGGGCAAA GATGCAAATT 720 

AGACAAATAC ATCAACATGA CTTTGCTCAA GTGGACCAGT TAATTAGAAC GGCATTTGAA 780 

AATAGTGAAC ATGGTTATGG TAATGAATCA GAGCTAGTAG ACCAAATTCG TCTAAGTGAT 840 

ACGTATGACA ATACCTTAGA ATTAGTAGCT GTTCTTCAAA ATGAAGTTGT AGGGCACGGT 900 

TTACTAAGTG AAGTTTATCT TGATAACGAG GCACAACGGG AAATTGGATT AGTGTTAGCA 960 

CCTGTATCTG TTGATATTCA TCATCAAAAT AAAGGTATTG GGAAGCGATT GATTCAAGCA 1020 

TTAGAACGAG AAGCAATATT AAAAGGATAT AATTTTATCA GTGTATTAGG ATGGCCGACG 1030 

TATTATGCCA ATCTAGGATA TCAACGCGCA AGTATGTACG ACATTTATCC ACCATATGAT 1140 

GGTATACCAG ACGAA6CGTT TTTAATTAAA GAATTAAAAG TGAACAGTTT AGCGGGAAAA 1200 

40 ACAGGTACCA TAAATTACAC ATCTGCTTTT GAAAAAATAT GATTTCAAGC TAGGATTACA 1260 

TTAGGTAGAG TTCATATTAA TAATAAAAAA TGTTTGCAAT CAAATCGTAC GTTGTCGTTT 1320 

GTAATTCTTA AAATAGCAAT AAATAAAATG TTTGTTAGTA AAGTATTATT GTGGATAATA 1380 

AAATATCGAT ACAAATTAAT TGCTATAATG CAaTTTTAGT GTATAATTCC ATTGACAGAG 1440 

ATTAAATATA TCTTTAAAGG GTATATAGTT AATATAAAAT ' GACTTTTTAA AAAGAGGGAA 1500 

TAAAATGAAT ATGAAGAAAA AAGAAAAACA CGCAATTCGG AAAAAATCGA TTGGCGTGGC 1560 

TTCAGTGCTT GTAGGTACGT TAATCGGTTT TGGACTACTC AGCAGTAAAG AAGCAGATGC 1620 

AAGTGAAAAT AGTGTTACGC AATCTGATAG CGCAAGTAAC GAAAGCAAAA GTAATGATTC 1680 
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GTCAAACACT AATAATGGCG AAACGAGTGT GGCGCAAAAT CCAGCACAAC AGGAAACGAC 1800 

ACAATCATCA TCAACAAATG CAACTACGGA AGAAACGCCG GTAACTGGTG AAGCTACTAC 1860 

TACGACAACG AATCAAGCTA AXACACCGGC AACAACTCAA TCAAGCAATA CAAATGCGGA 1920 

GGAATTAGTG AATCAAACAA GTAATGAAAC GACTTCTAAT GATACTAATA CAGTATCATC 1980 

TGTAAATTCA CCTCAAAATT CTACAAATGC GGAAAATGTT TCAACAACGC AAGATACTTC 2040 

AACTGAAGCA ACACCTTCAA ACAATGAATC AGCTCCACAG AGTACAGATG CAAGTAATAA 2100 

AGATGTAGTT AATCAAGCGG TTAATACAAG TGCGCCTAGA ATGAGAGCAT TTAGTTTAGC 2160 

75 GGCAGTAGCT GCAGATGCAC CGGTAGCTGG CACAGATATT ACGAATCAGT TGACGAATGT 2220 

GACAGTTGGT ATTGACTCTG GTACGACTGT GTATCCGCAC CAAGCAGGTT ATGTCAAACT 2280 

GAATTATGGT TTTTCAGTGC CTAATTCTGC TGTTAAAGGT GACACATTCA AAATAACTGT 2340 

ACCTAAAGAA TTAAACTTAA ATGGTGTAAC TTCAACTGCT AAAGTGCCAC CAATTATGGC 2400 

TGGAGATCAA GTATTGGCAA ATGGTGTAAT CGATAGTGAT GGTAATGTTA TTTATACATT 2460 

TACAGACTAT GTAAATACTA AAGATGATGT AAAAGCAACT TTGACCATGC CCGCTTATAT 2520 

TGACCCTGAA AATGTTAAAA AGACAGGTAA TGTGACATTG GCTACTGGCA TAGGTAGTAC 2580 

AACAGCAAAC AAAACAGTAT TAGTAGATTA TGAAAAATAT GGTAAGTTTT ATAACTTATC 2640 

TATTAAAGGT ACAATTGACC AAATCGATAA AACAAATAAT ACGTATCGTC AGACAATTTA 2700 

TGTCAATCCA AGTGGAGATA ACGTTATTGC GCCGGTTTTA ACAGGTAATT TAAAACCAAA 2760 

TACGGATAGT AATGCATTAA TAGATCAGCA AAATACAAGT ATTAAAGTAT ATAAAGTAGA 2820 

35 TAATGCAGCT GATTTATCTG AAAGTTACTT TGTGAATCCA GAAAACTTTG AGGATGTCAC 2880 

TAATAGTGTG AATATTACAT TCCCAAATCC AAATCAATAT AAAGTAGAGT TTAATACGCC 2940 

TGATGATCAA ATTACAACAC CGTATATAGT AGTTGTTAAT GGTCATATTG ATCCGAATAG 3000 

CAAAGGTGAT TTAGCTTTAC GTTCAACTTX ATATGGGTAT AACTCGAATA TAATTTGGCG 3060 

CTCTATGTCA TGGGACAACG AAGTAGCATT TAATAACGGA TCAGGTTCTG GTGACGGTAT 3120 

CGATAAACCA GTTGTTCCTG AACAACCTGA TGAGCCTGGT GAAATTGAAC CAATTCCAGA 3180 

GGATTCAGAT TCTGACCCAG GTTCAGATTC TGGCAGCGAT TCTAATTCAG ATAGCGGTTC 3240 
AGATTCGGGT AGTGATTCTA CATCAGATAG TGGTTCAGAT TCAGCGAGTG ATTCAGATTC " 3300 

AGCAAGTGAT TCAGACTCAG CGAGTGATTC AGATTCAGCA AGCGATTCCG ACTCAGCGAG 33 60 

CGATTCCGAC TCAGACAATG ACTCGGATTC AGATAGCGAT TCTGACTCAG ACAGTGACTC 3420 

AGATTCCGAC AGTGACTCAG ATTCAGATAG CGATTCTGAC TCAGACAGTG ACTCGGATTC 3430 
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CGATTCTGAC TCCGACAGTG ATTCCGACTC AGACAGCGAT TCAGATTCCG ACAGTGATTC 3600 

CGACTCAGAT AGCGATTCCG ACTCAGATAG CGACTCAGAT TCAGACAGCG ATTCAGATTC 3S60 

^ AGACAGCGAT TCAGATTCAG ATAGCGATTC AGATTCCGAC AGTGACTCAG ATTCCGACAG 3720 

TGACTCGGAT TCAGATAGCG ATTCAGATTC CGACAGTGAC TCAGATTCCG ACAGTGACTC 3780 

AGACTCAGAC AGTGATTCGG ATTCAGCGAG TGATTCGGAT TCAGATAGTG ATTCCGACTC 3840 

10 

CGACAGTGAC TCGGATTCAG ATAGCGACTC AGACTCGGAT AGCGACTCGG ATTCAGATAG 3900 

CGATTCGGAC TCAGATAGCG ATTCAGAATC AGACAGCGAT TCAGATTCAG ACAGCGACTC 3960 

AGACAGTGAC TCAGATTCAG ATAGTGACTC GGATTCAGCG AGTGATTCAG ACTCAGGTAG 4020 

IS 

TGACTCCGAT TCATCAAGTG ATTCCGACTC AGAAAGTGAT TCAAATAGCG ATTCCGACTC 4080 

AGTTTCTAAC AATAATGTAG TTCCGCCTAA TTCACCTAAA AATGGTACTA ATGCTTCTAA 4140 

20 TAAAAATGAG GCTAAAGATA GTAAAGAACC ATTACCAGAT ACAGGTTCTG AAGATGAAGC 4200 

AAATACGTCA CTAATTTGGG GATTATTAGC ATCAATAGGT TCATTACTAC TTTTCAGAAG 4260 

AAAAAAAGAA AATAAAGATA AGAAATAAGT AATAATGATA TTAAATTAAT CATATGATTC 4320 

ATGAAgnAAc rCCTTAAAAG GTGGCTTTTT TACTTGGATT TTCCAAATAT ATTGTTTGAA 4380 

TATAATTAAT AATTAATTCA TCAACAGTTA ATTATTTTAA AAAGGTAGAT GTTATATAAT 4440 

TTGGCTTGGC GAAAAAATAG GGTGTAAGGT AGGTTGTTAA TTAGGGAAAA TTAAGGAGAA 4500 

30 

AATACAGTTG AAAAATAAAT TGCTAGTTTT ATCATTGGGA GCATTATGTG TATCACAAAT 4560 
TTGGGAAAGT AATCGTGCGA GTGCAGTGGT TTCTGGGGAG AAGAATCCAT ATGTATCTAG 4620 
TCGTTGAAAC TGACTAATAA TAAAAATAAA TCTAGAACAG TAGAAGAGTA TAAGAAAAGA 4680 

'35 

TTGGATGATT TCAATATGGT CCnTTCCCA 4709 
(2) INFORMATION FOR SEQ ID NO: 588: 
40 (i) SSQUBNCB CHARACTERISTICS: 

(A) LENGTH: 1554 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

45 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 588: 
CTTTTTTAAt TAwCgGaAtA TTGtCaTgaT tAcAcTTCGt TAGGGTTTAc gTCGtAATTT 60 

SO 

CATTTaaTAA gCgCTTCAcC ATTAAAtGTG gTAmCCTTTA ATTCGCCAGT AGAAACATCA 120 
CAGTAACTAA GCGCAATTTC AGGTTGATTC ATAACAAAAC TTAAAATATA GTTATTTTGT 180 

55 
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CGTCTAACCA TACCTTTCGT TTGTTTCGGA TCTTCCATCT GTTCACAAAT AGCTACTTTA 300 

TATCCATTAT TAACAAGTGT ATCTATATAA CTATCTGCAG AATGATACGG AACACCACAC 360 

^ ATCGGAATTG GATTTTCTTT TTTAGCATCT CTTTTAGTTA AAGTAATTTC AAGTAyACGT 420 

GATGCCTCCT TGGCATCTTC ATAAAACATT TCATAGAAAT CACCTAGTCT AAAAAATAAT 4 80 

AAGCAATCTT GGTATTCTGA TTTTATTTTT AAATATTGCT GCATCATTGG TGTAACATTA 540 

10 

GACATATTAT TTCTTCACAA CCCTTGTCTC TTTTTAAAAT TTGTCTTTAC AATATATTCG 600 

TTTGTAAGyT TTTTAATTAT TAATTATTTA ACTTATACAT TTTAACATAC TTACTTTTAC 660 

AAACCTATTC ATACCATATA ATCACGAAGC ATCTTAAATG TATAAGAAAA CGCCTCAAAC 720 

15 

CTAATAAAAT GTGTCAATAG CATGTTTAGA ATTAAATTAA AATTCTAACA TTCAAGACAT 780 

TTAATTAAGT AAGGGCGTTC AATATTAAAA TGAACAATGA CTCTGTTTGA AATCATATAT 840 

20 CATAAAATTA TTTTATAAAC CTTTGAAGAA TACCACGITT TTTTAGAGTA ATTAATAAGA 900 

AATAACTTAT AATAGATCCG ATAGCACTTG aGACTATGaA CGTAATCATT AACGGTTTAA 960 

TGAAGAAGTC TTGAAGCCCA AGGaAATATG CTAATGGtAT aCaAATTAAA cTTCCgATGA 1020 

CaCCAGTTCC aAGTACTTCa CCGACCGCGG CCaTAAATAT ATGTTTACGA TATnygTAAA 1080 

ACATACTAGC CAATAAAACT CCAATCATAC TACCCGGAAA TGCAAAAGst GTACCAGTAC 1140 

CAAAAAGAAC TCTTAAAATT GATGATATAA GCGCTTGAGC TAATCCATAC CAAGGACCTA 1200 

30 

CTATGACCGC ACTTAATACA TTTACAAAAT GCTGTACTGG TGCTGCCTTA ACTGGTCCTA 1260 

GAGGAATGAT GATAATACTG CTTAATACAA CATTTATTGC AATTAAAAGT GCAGTTATAG 1320 

CCAGTTTTCT TGATTTCATA TGATTGTTCT CCTTTTTGTT TGTAATTAAT CACTATGCTT 1380 

35 

GGCTTTATTA TGGTCATTTA AACGTGTTTC CATTGITGAT ACAAACATTT TCAATAATTG 1440 

ATTCGCTTCA TATTGTGAAG TTTGAAACTG TTCAACTATG GGCAATGTAT TTATTTCTGC 1500 

40 TTCTAtACTC TGAATGGtAT GTTCCGACTG nXCCAGCGCA TTTGTTTCCC GnAA 1554 
(2) INFORMATION FOR SEQ ID NO: 589: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 638 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : doilble 

(D) TOPOLOGY: linear 

so 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 589: 
TTTTGACGAA AAAAGTTGAT TTACAAATAT ATAAACGTTG TGATTTCAAT GTTTGTATAG 60 

55 
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TATATACATG ACAGCAACTT GGGAAAAAAA GGAAGGTAAC GAAGGTTTAT TAACTGTTAC 
TGTTCCTGCA GAAAAAGTAA ACAAAGCrCT GAGAGATCCC CTCATAATTT CCCCAAAGCG 
TAACCATGTG TGAATAAATT TTGAGCTAGT AGGGTTGCAG CCACGAGTAA GTCTTCCCTT 
GTTATTGTGT AGCCAGAATG CCGCAAAACT TCCATGCCTA AGCGAACTGT TGAGAGTACG 
TTTCGATTTC TGACTGTGTT AGCCTGGAAG TGCTTGTCCC AACCTTGTTT CTGAGCATGA 
ACGsCCGCAA GCCAACATGT TAGTTGAAGC ATCAGGGCGA TTAGCAGCAT GmTATCAAAA 
CGCTCTGAGC TGCTCGTTCG GCTATGGCGT AGGCcTAGTC CGTAGgCAGG ACTTTTCAAG 
TCTCGGAAGG yTTCTTCAAT CTGCATTCGC TTCGAATAGA TATTAACAAG TTGTTTGGGT 
GTTcGAATTIc CAACArGTaA GTtAGtTGCT AGAnCCCA 
(2) INFORMATION FOR SEQ ID NO: 590: 
(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1242 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEONESS: double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 590: 
AAAATATTCC CGTACATTTT GATGTCTGTA GGGGCTTTTT TGACTTTAGG ATTTGTCATT 
TTTTCAATTC ATAAAGGGAG ACGAACGAAA AATGAATCAG CACGTAAAAG TAACATTTGA 
TTTTACTAAT TATAATTACG GCACATATGA CTTAGCAGTA CCAGCATATT TACCGATAAA 
AAACTTAATA GCTTTAGTAT TGGATAGTTT GGACATTTCA ATATTTGATG TCAATACACA 
AATTAAAGTG ATGACGAAAG GTCAATTACT TGTTGAAAAT GATCGACTCA TTGATTATCA 
AATCGCTGAT GGAGATATTT TGAAGTTACT ATAGGAGGGA AAATAGATGG TTAAAAATCA 
TAACCCTAAA AATGAAATGC aAGATATGTT AACGCCTTTA GATGCTGAAG AAGCAGCTAA 
AACAAAATTA CGCTTAGATA TGAGAGAGAT TCCTAAGTCT TCAATTAAAC CAGAACATTT 
TCATTTAATG TACTTATTAG AACAACATTC TCCATATTTT ATAGATGCTG AATTAACTGA 
ACTACGTGAC aGTTTCCaAA TACATtATGA CATTAATGAc AATCATACAC CTTTTGATAA 
TATTAAATCA TTTACTAAAA ATGAAAAATT ACGTTACTTA CTCAATATCA AAAATTTAGA 
AGAAgTAAAT CGTACACGCT ACACATTTGT GTTGGCACCA GATGAATTAT TTTTCACAAG 
AGATGGATTA CCCATTGCTA AAACAAGAGG GTTACAAAAT GTTGTTGATC CATTACCTGT 
GTCAGAAGCT GAATTTTTAA CAAGATATAA AGCGCTGGTT ATCTGTGCAT TCAATGAGAA 
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AACTAAAGTT ATTGAAGCGG CAACGTTAGA TTTACTAACG GCATTTTTAG ATGAACAGTA 960 

TCAGAAACAA QAACAAGATT ATAGTCAAAA TTATGCATAT GTACGCAAAG TAGGACATAC 1020 

5 

CGTTTTCAAA TGGGTTGCTA TCGGTATGAC AACGTTAAGT GTTTTATTAA TTGCATTCTT 1080 

AGCCTTTTTA TATTTTTCA6 TAAT6AAGCA TAATGAGCGC ATT6AAAAAG GATACCAAGC 1140 

ATTTGTAAAG GATGtTATAC GCAAGTACTA AATACGTATG ATGATTTAGA TGGTaAAAAt 1200 

10 

TgaTAAAGAG GCACTTTACA TTTATGCCAA AAGTTATATC CA 1242 
(2) INFORMATION FOR SEQ ID NO; 591: 

^5 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 744 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

20 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 591: 

TTCCAGATAG AGCCTTAGTT GCTGCCGCTG AATTGTCTGA TCGTTACATC ACTGATCGTT 60 

25 

TTTTTACCAG ATAAAGCGAT TGATTTAGTT GACCAAGCAT GTGCAACAAT TCGTACGGAA 120 

ATGGGATCAA ATCCAACTGA ATTGGATCAA GTTAATAGAC GTGTCATGCA ATTAGAAATT 180 

GAAGAAAGCG CACTTAAAAA TGAATCTGAC AATGCGAGCA AACAGAGATT ACAAGAACTA 240 

30 

CAAGAAGAGC TTGCCAATGA AAAAGAGAAA CAAGCAGCAC TTCAATCTCG TGTAGAATCA 300 

GAAAAAGAAA AAATAGCAAA TTTACAAGAA AAACGTGCGC AACTAGATGA AAGTAGACAA 360 

35 GCGTTGGAAG ATGCACAAAC AAATAACAAT TTAGAAAAAG CTGCTGAACT ACAATATGGA 420 

ACAATTCCTC AATTGGAAAA AGAACTTAGA GAATTAGAGG ATAATTTCCA AGATGAGCAA 480 

GGTGAAGATA CAGATCGAAT GATTCGTGAA GTTGTAACAG ACGAAGAAAT TGGCGATATT 540 

40 GTCAGCCAAT GGACAGGCAT ACCAGTTTCA AAATTAGTTG AAACAGAACG TGAAAAATTA 600 

CTTCACTTAA GTGACATCTT GCATAAACGT GTTGTAGGTC AAGATAAAGC GGTTGACCTG 660 

GTTTCAGATG CAGTAGTTAG AGCAAGAGCA GGTATTAAAG TnCAAACAGA CCTATTGGTA 720 
45 

GTTTCTnATT CCTAGGTCCn ACTG 744 
(2) INFORMATION FOR SEQ ID NO: 592: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1449 base pairs 

(B) TYPE: nucleic acid 
to STRANIDEDNESS: double 
(D) TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 592: 
TTGTTATAGT GTCTGAATCT GTGTAACTCT TGCCCATGTG TTCTGAGTAA AGCACCCACT 
GTTTATTTAC TTTTCGTTGT AGTCTAGCTT CGTGTAGTAG TTTGTTTAAC TTTTGTGCTG 
ATATACCGTA GTCTGCCGCG ATTTGAGTTG TGGCTAATGT GCCAGTTGAT TTTAAGATTT 
CATCAACATA ATCTGCTTTG GGTTTTAGCT CTCCAATTTC TTGTTGTAAA AGTAAGTTTT 
GCTCTTTTTC TTTCTTATAC TCAGTCAACA CTGTAATGAT GTAGTCTGGA TCTTTTAATG 
TTTGTTCAAT TACATTGTCT GTTGCGTATA TACCGTGTTT GCGAATAGCT GGTaGGACAT 
CTGATGTTAC CCAGCGTTTG AATTTTCTAG CGGTTTCTCT AATTTTTTCG TTTTTGCTTT 
GTTTAGAAGC ATCGAAGATT AGACTGTATA ATCCTGATTC GTTGATAATG ATCATATTTC 
TGTTTTGACC TGATGCACTA AATTGGTGCG TCAGTTTGTC CTCGCTATCA ACATGATTTC 
XAATGGCATT GTCTGATCTT GCATATCCTA AAATCTCAGC AATATCTTTT CCTACAAAAT 
AAGGTTCGTT TTCAATTTCT ACTGTTCTTA CTGGTAGCTC TTTAAAATTA AATGTTTGTA 
ATGCTTGCAT TTGAGTATCC TCCTTTTTCC TCAACACCCA CATTCAGCAG ACGGTTATCG 
CAATGACTAT CGAATGTATT TAAACGCGGC TCATATCATC GCCAGcTCTC GCTCACATCT 
GCTCAATGTG GATGTTGATA AGCGTGGTTA TATTAAGAAG TGAATGTTAC TGATTCACTT 
TCCGCCACTC TGTTAAATCA GTAACTTTGT TATCGCTTTC AACACCGTTA AGCTTGTCTA 
ACGCTTTCAC TACTTTTTGG AACTCTTTGA TAGCACTtCG TAGCTTTTTA GTAATTTCAT 
CTTCTACCAT TTCCAAACCA GCAAATGCGT CTTCGTTATT CATGCTTAGA TGTTTGTTGA 
AAAGATCTCG AGTGTATCTT ATTTCTTTAA GTGATTTATC ATAAGCTTCA ATTTGTCCTG 
AAAGGTTATG ATATTTTAGT TGTAGTTTTA CTAATTTTAA TGATTGGTCT TGCATTTGTT 
ATGTCTCCTT TAAGATGTTT GTTTGCGTTT CGTGTACTTT GTGGGTAAAA AAATATCTCC 
AATATTTTCG TCAAAAAAAT CAGCGATAAT AAACATCTCA TCATTCTTAA ATTGATGCTT 
TCCTAATTCT TTTAAACGAT AACCTTCAGT TGATATATTC AAGAGGTTTG CTAAATCTTC 
TTGAGTACAC TTTCTTTCTT TTCTCAACTT TATTAAATTC CATTGCATGT TGTCACCTCC 
CGCTTTACAA AACCTACTAT ACACGATACG GTACTTGnGT CAACATAAAA GTTTGCTTTT 
CGTGTATTT 

{2) INFORMATION FOR SEQ ID NO: 593: 
(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1170 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 593: 

5 ACCAAAAACA CTTTCTAAAG AAATTGTTTC AGAACCATTT GCTAAAAACC AATTACGTGA 60 

AAAAGCTCGT CTAACTAACA TTAAAGGTTT AGAGATTCCA AGAGTTTCAT ACACTTTAGA 120 

CGATGATGAT TTCATTACAG ACGTAGAAAC AGCAAAAGAA TTAAAAGCAA AAGGTGATAC 180 

AGTCAAGTTC ACTACTAATA AATTCAAAGT ATTTGCTGCA ATTTCAGATA CTGTAATTCA 240 

TGGATCAGAT GTAGATTTAG TAAACTGGGT TGAAAACGCA CTACAATCAG GATTAGCAGC 300 

TAAAGAGCGT AAAGATGCCT TAGCAGTAAG TCCTAAATCT GGATTAGAAC ACATGTCATT 360 

IS 

TTATAATGGA TCTGTTAAAG AAGTTGArGG AGCAGACATG TATGATGCTA ITATTAACGC 420 

TTTAGCAGAT TTACATGAAG ATTATCGTGA TAACGCAACA ATTTATATGC GATATGCAGA 480 

2^ TTATGTCAAA ATTATTAGTG TTCTTTCAAA TGGAACAACA AATTTCTTTG ACACACCAGC 540 

AGAAAAAGTA TTTGGCAAAC CAGTAGTATT TACAGATGCA GCAGTTAAAC CTATTGTGGG 600 

AGATTTCAAT TATTTTGGAA TTAACTATGA TGGAACAACT TATGACACTG ATAAAGATGT 660 

25 TAAAAAAGGC GAATATTTGT TTGTATTAAC AGCATGGTAT GATCAGCAAC GTACATTAGA 720 

CAGTGCATTC AGAATTGCAA AAGCAAAAGA AAATACAGGt CCATTACCCA GCTAAGCCCC 780 

AAAAGGTTAA TGTAACAGCT AAGGCTAAAT CAGCTGTAAT ATCAGCCGAA TAGGGGTGAT 840 

GAAATGAGTT TAGAAGAAAk TAAATTGTGG TTGAGAATTG ACTATAATTT CGAAAATGAT 900 

TTAATTGAAG GTCTCATTCA ATCGGCTAAG TCTGAATTAC TATTAAGTGG GGTnCCAGAT 960 

TATGACAAAG ATGACTTGGA ATACCCGCTT TTTTGTACAG CGATTAAATA TATCATTGCA 1020 

35 

AGAGATTATG AAA6TCGTGG ATACTCAAAT GACCAATCTA GAAGCAAGGT GTTTAATGAA 1080 

AAAGGATTGC AAAAAATGAn TTTGAAATTA AAAAAGTGGT AGGTGATTTT TAAATGGAAT 1140 

TTAATGAATT TAAAGATCGC GCGTATnTTT 117Q 

40 

(2) INFORMATION FOR SEQ ID NO: 594: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1393 base pairs 
45 (B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

so 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 594: 
TGAAGGGTGT TTTGTTTATG GCCAATTGCT GTGTTATTAA AnCGAATGTT TCGAATGGAA 60 
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10 



15 



20 



25 



30 



35 



40 



45 



50 



ATCATTCCGG 


AAGAGGACAT 


GTCTTCAGCT 


TCTGATTTGA 


AAGCACAGTT 


TTATCGCGGT 


180 


ACTTTGCAGC 


GCTTTTACCA 


AtCnTTGCAC 


GCAGAAAAGC 


TTACACCTTA 


TGTTATGTCT 


240 


TATGACGATA 


TCATTTCATT 


TTGTAAAGAA 


AACAATATCT 


CTGAAGTAGT 


GACTGCGGGT 


300 


GATATTATGA 


GTTATCATCT 


TGAAGAATAT 


GATATTTTAC 


ATCAACGTTC 


TTTATTCAAT 


360 


GAAGCACGCA 


TTGCCGTTAC 


TTTGATACGT 


GGGAATCATT 


ACTTTAAAGC 


GAGTAAAACA 


420 


ATGAATCAAC 


AAGGGGAGCC 


ATACAATGTT 


TTTACTAGTT 


TCTATAAAAA 


ATGGCGACCT 


480 


TACTTGAGGC 


ATAGAGACGT 


ATATCACTAT 


GATTTAAAAT 


CATTCGAAAA 


CTTTGTCATT 


540 


GCATCACCTG 


ATGATTTAGT 


GTTTGATGAC 


ATAGO^TTTG 


GATCCTCACA 


aATAATTGAA 


600 


CAGatAAATG 


GCAACATTTT 


TTAGATCAAG 


ATATACAGAA 


TTACGAAAGC 


GGAAGAGACT 


660 


ATTTACCTGA 


AGTATTAACA 


AGTCAGCTAA 


GTGTTGCTTT 


AGCATATGGA 


TTATTAGATA 


720 


TTATTGAAAT 


TTTTAATGAT 


TTATTGGCGC 


GTTATGATGA 


AGATGAGGCA 


AACTATGAAG 


780 


CATTTATACG 


TGAACTCATT 


TTTAGAGAAT 


TTTATTATGT 


GTTAATGACA 


CAGTATCCTG 


B40 


AAACCTCATA 


CCAAGCTTTC 


AAACCTAAAT 


ATCGACAGAT 


AAAATGGTCG 


CAAAATGAAG 


900 


CGGATTTTAA 


TGCATGGTGC 


GAAGGGCAAA 


CAGGATTTCC 


AATCATTGAT 


GCAGCAATAA 


960 


TGGAATTGAC 


ACAAACTGGT 


TTTATGCATA 


ATCGAATGAG 


AATGGTTGTG 


TCGCAArrrr 


1020 


TAACCAAAGA 


TTTATTTATA 


GATTGGACAT 


GGGGAGAAAA 


ATTCTTTAGA 


AAGCACCTTA 


1080 


TTGACTATGA 


TGCAGCATCA 


AATATTCATG 


GATGGCAAT6 


GTCTGCTTCT 


ACAGGTACGG 


1140 


ATG CAGTGCC 


GTATTTTAGA 




CAATAAGACA 


GAGTGAACGC 


1 X x\aAx\3\m xA 


1 ^ rt A 


AAGCTTTGTA 


TATCAAAACA 


TATCTTCCGA 


TTTTTAATCA AATTGATGCA 


AAATATTTGC 


1260 


ATGATACACA 


ACGCAATGAG 


TCCAACCTTT 


TTGAACAGGG 


GATTGAATTA 


GGTAGTCATT 


1320 


ATCCAAGACA 


AATGGTAGAT 


CATCAAGAAA 


AACGTACACA 


AGTTTTAGCT 


ACATTTAAAG 


1380 


CGCTAGACTA 


ATT 










1393 



(2) INFORMATION FOR SEQ ID NO: 595: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1484 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: doioble 

(D) TOPOLOGY: linear 



<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 595: 
TTAACTTGAA AGATTTCCCC GACATCTATA ACTTGTATAA TGTGTATATG TC GTT TT T AG 60 
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AAAAATTAAA AAAAGAATAT CTTGATTGGT ATAATCAGAC CTTAGAGTTT TCTAATTTAT 180 

CAAACAATGT AGTAAGwATA GATACTCCTT TTAAAGATAA TTCTTTAGAT AATTTAATAA 240 

5 TTTACGCTTT ATACGATCAG TCCAGAGACA TGATTACACT GACAGATGAC GGCTATACTA 3 00 

TATtTGATTT AGAAAATAAT GGTATTTCTT TAAATAAATC AAAAAAACGT AAAAAGATTT 360 

TTGAAGAGCA CCTTTGAGCT TACGGTATTA AATATAACGA TAAAACTCAC GAAATTTTTG 420 

10 

TTCAAACTAA CTTTAAAAAT TTTAATAAAT CGAAACATAA TTTATTACAG TGCCTTATAT 480 

ITGTTAATGA TATGTACTTA CTTTcTAATC CTAAGTCACA GAACATATTT ACAGAAGATG 540 

TTGCAAACAA ATTGGATGAA CATAACATTT ATTACGGAAG AGATTTACCT ATTATAGGAA 600 

75 

GCAGTGGTGT TGTTCATAAT TTCGACTTTT TTATTAGCGC TAAGAAAAAT CAAAAAGAAA 660 

AATTTATCAA TGCTATTTCT AACCCTAATA ATTCTATGAT TATTAAGTCX3 AAAATAACGG 720 

ATGCTATGCA AGCAAAAAAA ATAAAAAGAC ACAGGCAAAA TGAGTTTATT TTTATTTTAA 780 

ATGACTCAAA AAAAGAAATA AATGAACATA ATAAAAATCT TCTTCATGAA AACTATATTA 840 

GTACAATAGA TTATAGCGAA TTAGATGAAA AGATAGGTTT ATTGATTTAA TATATATAGA 900 

25 CGTGATAATA TCAATGTTTA TATTAAATGA AACGAATTTG AAAATTTCGA AACAGCTTAA 960 

GATAGCAAAT TGAATAGCCT TATTGATAAT GCAGAATCGT CTACACTTAG TTGAACAAAT .1020 

TCTATGAGAA TAGATATTGT TAAACTATTT GGGTAGGCGA TTTTATTTTG ACAAGAGTCA 1080 

GAAGATTATT TAGTTCATAG TTTAAGTTAC AAATGGCTAA ACTTTATGAA AATGGTATGA 114 0 

CTAGAATCGA AATTATACTC GAATACGATT TAACACTCTC AATCTTCTCG AACTGAATAA 1200 

ATACTGGGTC ATTCAATCAT CAAGACAACT TAATAAGTGA TGATAAATGT TCATACCATT 1260 

35 

TTGCAAATAT AACCAGATAC TCTCAACAAA ATGTAGAGTT CAAAATTAAA AATGTCCCTA 1320 

ATTGGCACAT TGCTGTATGA TAATAAATTC AACTTAGATT TCAACAATAT AACTAATGAT 1380 

GCTTATATTT ACCGCGATAT CAAACCAAAC AGCCCATCCA CAAACAAATT AGAATATATC 1440 

40 

mTGTTAATAA TAGTAAATGA TATATCTTCC AAAGACCGCA AACT 1484 
(2) INFORMATION FOR SEQ ID NO: 596; 

4S (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 14 35 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: dotlble 

(D) TOPOLOGY: linear 

t. 

SO 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 596: 
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CTTTATCaTT AAATGCCaTT TTGaATCCTT 


CTTGAATTTG TTTGATTTCC 


TTTTCAGTAT 


120 




TATTAACCTT GTTCAAGACA GTGCCATTAA 


TTTTCTTCTT 


GAGTGGACCA 


ACCTCATCTT 


130 


5 


TATTAGTTGA TTCATGAATC GTTAATCCAA 


TGTGTGGCTG 


TATTCTATAA 


CCATCATTCG 


240 




CTATACTTGA AACATATTGT GaTAATTGTA ATGGTGTATA GGTATCATAT TGACCAATTG 


300 


10 


ATAAATCTAG ATAATTACCT GGATTATTTG 


TTAATGGTTC GATTTGACCT CTTGTTTCAT 


360 


TTGGTAAATC TATCCCTGTT TTCACACCTA AGCCTACTTG ATTTAATCCT CTTCTTAGCT 


420 




TTTOQGCAGG TGAACTTATX5 TCTGAAGGTA AAGCCATACC AGAATAATAA GGGTCTCCCG 


480 


IS 


CTAATTTTAA TGCTGTTTTA AACATATATA 


CGTTTGATGA ATGCATCAAA GCTTGCTTAT 


540 




CATTAATAGT TACATGCCCG TTTTTATTGA AGTATGATCG 


TTTTGTCAAA 


CCACCTTGGA 


600 




AATGTAATGG TTCATCGACC ATTGTTTCTC 


CAACTTTGAT 


AGCTTTATTC 


TGATAACCGG 


660 


20 


CTAATAATGT TCCACCTTTT ACAGAAGATC 


CAACCGCAAA 


TTGAGAAGTA 


AACGTACCAA 


720 




TGTCATAATC AGTCATTTTA CCACTCTTAT 


TAATCTGCTT 


TCCGGCAAGC 


GCAAGAATGT 


780 




CTCCATTTTT AGGATTTTGT ACAACCATCA 


TTGcATTATC 


CATATCTTTG 


GCACCTTGAC 


840 


25 


TGCGAsTTCT TAATTTGTTT ATCTAATAAT 


GCTTCTACTT 


crrx-ntJAAG 


ATCTATATCG 


900 




ATCGTTAATT TCAAATCTTG ACCGCGAGCG 


CCAGGrTTTA 


ACACTTCTGA 


AGATGTAACT 


960 




TTACCAGATT TGTCCGTTGT GTATTTCATT 


TCTTTCTTCT 


TACCACGCAA 


TACATCTTCA 


1020 


30 


TATTGATATT CTAGGTAAGA TTTTCCAACA 


CGATCATTGC 


GTGAATATCC 


TTTGGATAAG 


1080 




TAATGTTCTG TCAATTCTTT TGGaATACCT 


TCAGCAGGTG 


TCGATACATC 


TCCGAATATA 


1140 


35 


CCTCTTAAAG TATCGCCATA TGGATATTTT 


CTATCCCAAT 


CCATAGACGT 


GTTAACACCT 


1200 




GGTAATTTGG AAAGTTGCTG AGAAACTGCT 


GCATACTCTT 


TTTCACTGAC 


ATCTTCATTT 


1260 




TTTATCATTT GTGGATCTAA AACTGTTCCT 


GGCATTCATC 


TCTCGAAAAA 


TAGCTAAAAC 


1 1 n 
i. J Z U 


40 


TTGGTAAATC TTTAGAAGAC AATTCATCTA ATTGTGGATT TTCCGGATTT 


CGGATAACAG 


1380 




TTGGTnTATC CATAATGGAT CCTGGTTTAA TACCTTCCAn 


CnGGCGAACA 


TAGCC 


1435 




(2) INFORMATION FOR SEQ ID NO: 597: 








45 


<i) SEQUENCE CHARACTERISTICS 


: 









(A) LENGTH: 516 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



so 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 597: 
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. AGAAAAAGAT TTAGAAAAGA TTACCATTCG CGACATAACA ACACGCGCTG ATATCAATAG X20 

AGGGACATTT TACTTACATT ACGAGGATAA ATATATGTTA CTCGCAGATA TGGAAGATGA XBO 

5 

GTATATTTCA QAACTAACGA CATATACTCA ATTTGATTTG TTACGCGGTT CTTCArTTGA 240 

AGACATTGCG AATACTTTTG TAAATAATAT ACTCAAAAAT ATTTTCCAAC ATATTCATGA 300 

TAATTTAGAG TTTTATCATA CTATTTTACA ATTGGAACGC ACGAGTCAAT TAGAATTGAA 360 

10 

AATCAACGAA CATATTAAAA ATAATATGCA ACGTTACAT7 AGTATCAATC ATTCTATCGG 420 

AGGCGTTCCA GAGaTGTATT TTTACAGTTA CGTTTCCGGA GCAACAATTT CaATTAnnTA 480 

,5 AATACTGGGG TAATGGACAA ACAGCCCATT TTCAGT 516 

(2) INFORMATION FOR SBQ ID NO: 598: 

(1) SEQUENCE CHAHACTERISTICS : 

(A) LENGTH: 1955 base pairs 
20 (B) TYPE: nucleic acid 

(C) STRANDEONESS : double 

(D) TOPOLOGY: linear 



. (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 593: 

AGTACTTTAC CATGAGGTAA GACTTTATTC CCTGCTTTTA TAGATTGTGC TTTTATTTGT 60 

GTGCCAGAAC CAATAGtAct GGTcTAATGA TTTTGCACTC ACATTATCAA TAGCTTTTTG 120 

30 

TTTGTCTTGA CCTTCAACAT CTGGCACTTT ACTATACTCT GCATTAGATG TGTCATCTTT 180 

TGATTTACCT ACATTTAAAT ATTTCAAAGT ATTTTCCATT ATTGGTTTAA ACGCTTTACT 240 

AACACCTAAT TCATAAGCTT CTTGGTCATT TTTTTGTGCC AAGCTCATAC CAGCGTATAC 300 

35 

AATAACTTTA GGATTTTTCT TCGGCGCGTC ACCCATAAAA CTTACAAAAT ATGGGTTTGG 360 

ACCTTTAACG TATCCACCAC CATTAGGTGC AGCGACTTGT GCTGTACCAG TCTTACCTTC 420 

40 GACCTCATAA CCATCAATAC GATAGTTTGC AGCGTGACTC TTCTTACTAT TCACAACTAA 480 

ATCCAATTGC TTTTCAACTT TTTCAGCAGT ATCTTTTGTT ATTGGTTTGC CTGCGATTTG 540 

TTTTTGCCCT TTATAAAATT GTCTTTTACT AACAGGATTT TCAACGCTAT TCACAAACCA 600 

45 TGGTTTTAAC ATATTACCAT CATTAAAGAA CGCTGATTGC GCTTGTAACA TTTGAACAGG 660 

TGTTACTGTT GTCGATTGAC CAAATGATGA CGTTTTTTGt TGCAACTCAT TACTCCATCC 720 

AATTTGaCCA GGTGCTTCTC CATCAAACAT ACCTTTAGTT GaTTTTCCaA ATCCaAATCG 780 

SO 

TTCATACCAA GATTTCATTT TGTCTGCACC AACTAAATCT TGTAAATGCA TCATCAATGT 840 

ATTAGATGAA TAAGTAAATC CGAGTGACAT TGGGATTTCA CCCCAACCGA CTCTATTCCA 900 
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10 



AAAAGCACCT TCTTGAATAG CAGCTGCTAA CCCATATGAT TTAAATGTTG ATCCAGGCTC 1020 

GTATGTGTTT TGATAAAGGT CATTTGCCCA CTTTTTACCA AAGTCTTTAC CAGTTTCAGG 1080 

ATTAAATGTT GGTCGCTGAC TGTATGcTAA AATTTCTCCA GTTTTGGCAT CCATGACAAC 1140 

CGCAAATAAA TCTTTCGGCT GGTATCTTTC AACCATGCCA TCTAAAGCTT CTTCAACAAA 1200 

TACTTGAATA TTTGAATCGA TTGTTAAATG GACATCATCA CCACGTTTAG GCTGCTTCTC 1260 

TTTTTTAGTA TTTGGTGCGA TATATCCCCA AATATCATGA ATATATCTCA ATGATCCTTT 1320 

AGATCCACTT AAATAACTAT CAAAAATCTT TTCAACTCCA AGTGCACCTT TAAGTTCACC 1380 

,5 AGTATCCGGA TTTTTCTGAG CTCTACCAAT TAAGTGTGAT GCAAAATTGC CATTTGGATA 1440 

AAAGCGTTCT GTTTCAGGCA ATAAAGAAAT ACCAGGCAAA TTCATTTTCT CTATTTTCAA 1500 

TTTGTCCTGA TACGTTAAAT TTGTTCCTTT GCGTCCAAAT TCAATTTGGA AAGCTTTCTT 1560 

20 TTGACTAAGT CTCTTTTCAA TTTCCTCTGG CTTCATATTA ATGACTGTAG ATAATTTCTT 1620 

TGCAGTCTCT TTTTTATCAA CTACATGCCT AGGTTTTTTA GAATTGGCAC TCGCCTTTTT 1680 

ATCTATTACT GCAACAAGTT TATATCTTTC TACATCTTCT GCTAGCACTT TACCATkACG 1740 

ATCATATATC TTTCCTCGTT CTGGTTGTTG TGCATTCTTA ACTAAATACT TTTCATTTGC 1800 

CTTCATGACT AAATCTTGAC CATTAGAATG TCCAGTAATC ATGATATATG AAATTCTTAA 1860 

AACCAATATA AAAAAGAGCA GTCCGAATAA ACCAACAAGT AGGACTGCCC CTATTTTATT 1920 

TTTTTTAATT TTAATTTTTT TGGTCGCCAT TACTA 1955 
(2) INFORMATION FOR SEQ ID NO: 599: 



25 



30 



35 



40 



45 



SO 



55 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 7 04 base pairs 

(B) TYPE: nucleic acid 
(C> STRANDEDNESS: double 
(D) TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 599: 

TAGCAAGAGT AGGTGATAAC AGTTCTTTTA ACGTGTTTGC TGCTTGCTCA TTTCTTGGCT 60 

CATTGTAGAC TAAAATATAA TAAGCGTTTT CAAATAAGTG CTTTTTAGCA TTTAGTACAC 120 

CAGATTTATG ACTACCAGCC ATTGGATGAC CACTGACTAA ATGAATATTA TGCTTTAATA 180 

AATTGCATTC GTGTTGCTGT ATCATTGCTT TAGTACTACC AGTATCAGAA ACAATAACAC 240 

CAGGTTTAGT TGGCATATCT ATAAGCTCGC TAAGATATTT ATTTGTGATA GCAACAGGTG 300 

TTGCATAAAT AATTACATCG GCTTTTTTAA TAGCTTCACT ATAATTTAAA CATTTTTCAT 360 
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10 



IS 



30 



35 



40 



50 



TATTAGTATT AGGGTTATGG TATTTTATAT TGCTAGCAAG ACTTCCACCA ATTAATCCAA 480 

GCCCAACAAA XAAAACTGTT GTCATATAAA TCACCTTATT TCGAAATTTT CAGAATAATA 540 

ACATTGTAAA TGAGCTGTTG ACACAGTGCA ATAGTAAATA AAAATCGATA ATAGCATTAA 600 

TAGATAAACG GAGATAAATC ATCTACAATA AAGAGTATAG TAACACAATG GCAACGGAGG 660 

GGTAAATCAA TGGAACCAAT ATTAGAAATG ATtAAAACAT TAAC 704 
(2) INFORMATION FOR SEQ ID NO: 600: 

Ci) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1158 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



20 (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 600: 

CCTCTAAAGG ATCACGAACC TTTTTCATCG TGACTAAGCC TATAATACCC TTAAAcCTAT 60 

TATTATTAAC TTTTACCTCT GTGTATTCCC TATCAATTAG GCGACGCCAG TGACGTTTAT 120 

CTATATACTT TACTTTCACA GTCACCAACT CCTTGTCATT ATTATATAAA ACTACATAAA 160 

TGATGTCATG TCATGATACA GTTTTATAGT TTTTGTTAAT CATATGAAAA TATTTATTAT 240 

TATTTTACTA CAACTCGCTT CAATTTACTT AAAATAGACA ATATTAATTA GATAGTACAC 300 

ACATTTCTTC ATAAAAGTGA TTTTTCAAAA ATATAAATAA CACACTCTTA TCGTTTTCAA 360 

AATCATTTAA TGCTATTTTC ATTAAAAACA GCTGAAGCAT CAAATCTATT CTGATTCAAT 420 

CAAGAATACA TATAAAAATG AAGTGACTCA AAGGTTTATT AACAACCTTC AAACCACTTC 480 

ATTGATCACT TTTATTTTAA AGCATATTTT TCGATTACTG ATTTAAGATG CGGATATTGC 540 

GTAATTAATT CAGATTGCTT AAACAATTCA AACTGCTTAA ACTCAAATGC CGGTTGACAC 600 

ATACAACCTA CTAAACTAAA AGTATTTGAT ATTTCGATTG AAGAAGCAAA AATTGTTCCT 660 

TTAGGCACTA CATATTGCAA TACATCTCCA TTTTGGATAT CAGTACCCAA TGTTGCAGTC 720 

GTATATTCCC CATCCGGATT TATCATATGA ATTGTTA6AG AATCGCCAGC ATGATAGTAC 780 

45 CATACTTCAT CAGCATCAAT TCGATGAAAA TGCGAAATAT TGTCATCTGT AAGTAAAAAA 840 

TAAATACTAC TAAACGGCGC TCTGCGTCCA TCTTTCAATA CTTCTCGAAT TGTCTCTCTA 900 

TAGAAACCAC CTTCAGGATG TGATTCAAGT TGCAATTcAT CaATCCATTG TTCTGCTGAT 960 

TTCATTATTT CAAATCCACA TTATGGAATA CGTTTTGTAC ATCTTCTAAA TCTTCTAATG 1020 

CATCGATTAA TTTTTCAAAT GTTACTTGGT CCGCTTCAGA AAGTTCAATA TCTGTTTGAG 1080 
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GAACGACTGC AAATTGAT 

(2) INFORMATION FOR S£Q ZD NO: 601: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: B27 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 601: 
TGATACTTAT TTTTCAATAT TATTTGGAAT AAAnTCTTnT AATTGTGGTG TGAAATAAAC 
ACCGAAATTC TTTTCAGATT CATCTTTTcC ACTACCTGCA TATAAAATAC CAATCAGTyC 
ATGTTTAGAA TTCAATACAG GAGATCCTGA ATTACCTGGT TGTGCATACG CATCAAATTC 
CATAAACGTT CCACTGATAT QGTTAATCGT TCCTGTCGAT TCAAACATTT TATATTTTGT 
TTGTGCACCC TTTGGATAAC CAATAACAGA AATTCTATCT TTCACTTTTG CTCCGTCTGC 
AAATTTTGTA TAACTAACGT TCTTATTAAA ATTCAAACCT TCTGTACTTG TTTCATGAAC 
ATGAACTATC GCAAGGTCTT CTTTTCCGGG ATATTCTACA ATGTCTTTAA CGTCGTAGTT 
TCCTCCGCCT TTACCTTTAC TCGAATGATG TGCTGATACT CTATTTTTAA AAATATCATT 
ACTTTTAGCG ATATGTTTGT TAGTTACGAT TGTATTTTTA CCAACAACTA CACCAGTACC 
ACCCACAAAT GCTACCACTG aATTGTATGG TTCCTTAGTT GCATCGGTAA TTTCTTTGAC 
ATTCTTTTCT GCTTTGGCAA TTGAATGArG CTGATTAG7\A ATATTTTCAG CAAAACCAAG 
AGATGTTAAA ATAGTTAAAG CAGTTAAACC TTTAACCATT ACATTTTTAT TCATATTTTA 
CCTCCTTCCA AATTTATTTT nATAGTTAAT GTATCTAGAT ACACATTTAC TATATACATT 
TTAAATAAAA ATATTnATTA AATATTAATT AACCACTTAT nAACGTT 
(2) INFORMATION FOR SEQ ID NO: 602: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 796 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 602: 
nGGnACGTAA AGTATTTATG TTAAATGGCA nAAATATATG AATGATGAGT TACCTGGATT 
ACCAATGTTC CAAGGTAAAT CGATAACTAT TGTTAACGAT AAAGTACGAA ACTTAGACAT 
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CGACGATTTT GTCGAGGTTT ACTTATATGG GGGGATGTTA TGAATAATGT ATTGTTAGAG 
GTTAAAGATT TAGAAACATC ATTAAAAATA AATAATGAAT GGTTAGCAAC TGTTGAAAAT 
ATTTCTTTTG AATTATCTAA AGGAGAAGTT TTGGGTATAG TAGGGGAATC TGGTTGCGGT 
AAGTCCATAT TAAGTAAGTC AATTATTAAA TTATTACCAG AAAAGATATC TAAACTAAGT 
AATGGAGAAG TTATATTTGA TGGTAAACGA ATCGATACGC TCAATGAGAA GCAATTGCTA 
GATATTCGAG GAAATGATAT TGCTATGATT TTTCAAGAAC CTATGACTGC TTTAAATCCT 
GTATTTACCA TAAAAAATCA ACTTGTGGAA TCTATAAAAT CACATAAAAA AATTTCTAAA 
AAAGAAGCAA ATAAATTAGC AAAAGATTTA CTAAAAAAAG TTGGAATTGC TAGACAAGAT 
GAAATATTAA ATAGCTATCC TCATCAATTA TCTGGTX3GTA TGAGACAAAG AGTAATGATT 
GCAATGGCCA TTTCATGTTC TCcTAAATTA TTAATTGCTG aTGAACCTAC AACAGCATTG 
GATGTCACGA TTCAAG 

(2) INFORMATION FOR SEQ ID NO: 603: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: X618 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 603: 
GGATGTGTTC ATCCCAAATT GaAAcAgAaA TTTATGATCA AAtGATGTGG ATTGGTTTTA 
AaCCATTCAa AATTaCCAAT ATTAmaCAAG AATCTGAAGA CATTAAATCA TTTtACAGTT 
GAAACTGAAG AATATGACTT TAGTGAATTT ACACCAGGCC AATACATCAC AGTTGATGTT 
TCTAGTGATA AACTTCCATA TAGAGCTAAA CGTCACTATT CTATCGTATC AGGTGAAAAA 
AACCATTTAA CTTTTGGCGT TAAACGTGAT GTCACAACAG AACATGAAGG CGAAGTTTCA 
ACAATTTTAC ACGATGAGAT TAAAGAAGGC GATATGATTA ATTTASTGCG CCTGTAGGTG 
GATTCGTATT AGAGAATACG ACTGAACCAC AACTTTTCTT AGGTTCAGGT ATTGGTGTTA 
CACCTTTAGT AGCTATGTAT GAAGCTGCCT CTGCCAAAGG TTTAGATACA CAGATGGTTC 
AAGTTGCTGA AAATGAACAA CATTTACCTT TCAAAGACAA CTTCAACAGT ATCGCAAGCC 
ATCATGACAA CGCTAAATTA TATACACACT TAnAgATAAA CAAGGCTATA TTGGTGCTGA 
AGAATTACAA GTATTTTTAG CAAATAAACC TGAAATTTAT ATCTGTGGTG GTACAAAATT 
CTTACAaTCT ATGATCGAAG CACTTAAATC TTTAAATTAC GATATGGATC GCGTACACTA 
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ATATGAAACT TAATCAACGT TACGTAAAAG TATTTGCATT ATATTTCGTA AGTATTGTTA 840 

CTGCAAATAT TATTGTTAAA AATAATAATT TAATTAAAAC AtTGATACAA ACCATAGCCG 900 

GGTACACGGT CTTTGCAGTT GGTTTGAAGT ATTTAACTAA ACGTAAAAAT AAATGACATC 960 

TATACCAAAA CAGCTATGAC TTTACTTTGT CATGGCTGTT TTTTAATTGG GAGTAGGACA X020 

GAGATGATAT TTTCGCAAAA TTTATTTGGT CGTCCCACCA CAACATGCAT TGATGTATGC 1080 

TCACTGAATT TCATAAGAAA GGAGTTCACA AGA7GACCGT AGATATTGGA CGGATTTATG 1140 

ACAATAAAGA TAATACCGAC GCTATTCGTA TCCTAGTCGA TAGAGTCTGG CCGAGAGGTA 1200 

15 TTTCGAAAAG AACTGCTAAC CTAGATTATT GGTTAAAAGA CATTGCCCCT TCTACTGAGT 1260 

TGCGACAATG GTTCCAACAT GATCCTAAAC TTTTTGGAGC TTTTAAAGAA AAATATGAAA 1320 

AAGAATTACG TGATCAGGAT GCGCAAAAAG ATGCTTTTGA AAAATTAAAG GATATTGTAA 1380 

ATCAGCATAA TCATGTTCTA TTGTTATATG CAGCAAAAGA TACTAAACAT AACCAAGCTG 1440 

TAGTACTACA GCAGTTGCTC AATACTTAGT TATATATGTT TATCGTGAAT CACTATAAAT 1500 

GTCGCTAACT TCATTTCTAA TATTTATTTT TAAAAAGCAT AATTACTACA ATTAATTGGA 1560 

ACTTTAATAA TTACTAAACT TGGAACAATA TTTTACTTTA ACAAAATAAA GTTTTAAA 1618 
(2) INFORMATIOK FOR SEQ ID NO: 604: 

30 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2115 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

35 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 604: 

ATTATAATGC AAATATTGAA GCATTTAAAA CAGTCGCTAA AGCAGTAGGC AAAGAGAAAG 60 

AAGGCGAGAA GCGTCTGGAA AAGCATGATA AAATATTAGC GGAGATTAGA AAGAAAATTG 120 

AACAGAGTAC GTTAAAATCT GCATTTGCAT TCGGTATCTC AAGAGCAGGT ATGTTTATTA 180 

45 ATAATGAAGA TACATTTATG GGACAATTCT TAATTAAAAT GGGTATTCAA CCTGAaGtCA 240 

mAAAArAmAA AACTACGCAT GTTGGTGAAC GCAAGGGTGG TCCTTATATA TATTTAAATA 300 

ATGAAGAACT TGCCAATATC AATCCAAAAG TTATGATTTT AGCCACTGAC GGAAAAACGG 360 

SO 

ACAAAAATAG AACGAAATTC ATTGATCCTG CAGTTTGGAA ATCATTAAAA GCTGTGAAAG 420 

ATAACAAAGT TTATGACGTT GACCGAAATA AGTGGTTGAA ATCAAGGGGG ATTATCGCAA 4 80 

GTGAAAGTAT GGCAGAAGAT TTAGAAAAAA TTGCAGAAAA AGCAAAATAA AAATACAGCG 54 0 

SS 
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TGTGATGATT TACCTGAAAG TTTATTTCGA ATAAATTTAA TTACATAACC GACAAGGATT -660 

GTTTTAACAG TTCTTTTAAT GAATTGGCGC ATCGTTACAT ACCTCATTTC TCTATATCTT 720 

ACGAACTATA TACCCATTCA TATATGCTTT TTAAACGTCA TTGTCACAAT TTAATTTTTA 780 

GGGAATATAA TATAACCATC TTTATCTGCT TTTTTAGTAA AAATGACAAA AATTGCATGT 840 

ATTATTGaGA TGATGGTAGG GATACCTGTC CAGAAAAATA ATAAGTGAAA AAGACCTTGT 900 

CCAAATTTAT CAGCATAAAA TTTATGaATA CCTA?VACCTC CAAGAAATAA TGCAACniATa 960 

ACATAAATGG CTTTATTGAC TTTCATTTGT AAtCCTCCTT AACTATAATT CTACTTAAAT 1020 

75 TCGTTGTGAA AACCAATATT TCTAACTTTA GAATTTTCAA ACTTTCTAAA ATTATAAGTA 1080 

TATCTTTTTA AAATAAGCTA GAATTTCTAT ATAATAAATG TTAATAACGT TIAAAGGGAAT 1140 

GATGACATAG TGATACGTCA AGCACGTCCA GAGGACCGAT TTGATATTGC GAAGTTAGTT 1200 

TATATGCTTT GGGATGATAT GGAATTAGAA TTGGTAAAGC ATCTACCTAA AGACATGGTA 1260 

TTAGATGCAA TTGAAAAAAG CTGTGTTGAT GCAACATATC GAACTTTTTA TCAGCATATT 1320 

TTAGTTTATG AAGTAGAAAA TAAAGTAGCA GGTTGTATTA TTAGCTATAG TGGTGAAAAT 1380 

GAATTGAAAT ACGAAAAAGC ATGGGAACTA CTTGACTTGC CAGAAAAAAT AAAACAATAT 144 0 

GGCACGCCAT TACCTGTAAA AGAAGCTAAA GACGATGAGT ATTATATAGA AACAATTGCG 1500 

3^ ACATTTGCAG CATATAGAGG TAGAGGCATC GCGACAAAGT TATTAACGTC ATTACTTGAA 1560 

TCAAATACAC ATGTTAAATG GAGTTTGAAT TGCGATATTA ATAATGAAGC AGCATTAAAG 1620 

TTATATAAAA AAGTAGGCTT TATATCTGAT GGACAGATTG AATTATACAA GCACATGTAT 1680 

CATCATTTAA TTGTTAAATA AAATACTCGA CAGTTCGATG TAAGTCGATT GCCGAGTAGT 1740 

ATCATTTTCT ATTAAATGCC TGCAAATAAT GCACTAATAT AAATACCTAA TGCATATAAT 1800 

AAACCGAAAA ATGTATTTGT TTTACCAGCA GCAGCCATTG CTGGCATCAT TGTAGGCGGT 1860 

40 

GTATCATTCT TCTTGAAACX3 TCTGATAACT TTAACAGGCA TTGGGAATGA TAACAACGCA 1320 

AGTAAGTAAA ATAATGAGCC ACCAGGTTTA ATAATGATCG TAAGTACAAT AAAGGCATAA 1980 

45 GCGATAAAGT ACATGATTGC CATAAATGTT AAAGAAGCAT TTTTACCTAA TAGAATGGGT 2040 

AAAGTTTTGC GACCACTTGC TTTATCTTTG ACACGGTCGC GAATATTGTT AGCCATATTA 2100 

ATTAAACCGA TAGTG 2115 
(2) INFORMATION FOR SEQ ID NO: 605: 



25 



SO 



(i) SEQUENCE CHARACTERISTICS: 

(A) - LENGTH: 1003 base pairs 

(B) TYPE: nucleic acid 

55 (C) STRANDEDNBSS : double 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 605: 
TATGTCTCAA ACTCAAATTA ATCAAATGTT CCAGCAGAAA AACATGTCTA CTGAATTAAA 
ACGTCGTTAT GCACAACGTT TATTACAGTT TCCACATGTA CACAATAAAG AATACTTGAA 
ATCTTATGCT AAAAACCCTA AAGAAACTAA AGATAGTTAT ATTTCTGGTT TTAAAGAGAA 
TCAATTGATT AAAATAGAAG CGATTAAATC ATTGTTTGCA ATGGATAAAT CTCCATTAGA 
ACATGTTAAA CCTGCTACAA AACCAGACGC TTCTTGGGAT GAGATGAAAC AAAAAGCAGT 
TGAAATTGGT AAAGCTGATA CTACATCGAA TAAATTTGGT ATTAGAGATC AATACTGGAA 
ATTAATTCAA GAAAGTAAGC GTAAAGTTAG ACGTGACTAC GAATTCAATG TTAATTCTCC 
AGAATTCCAA GATTTAGAAT TACTTGTAAA -AACAATGCGT GCTGCTGGTG CAGATGTTCA 
ATATGTAAGT ATTCCATCAA ACGGTGTATG GTATGACCAC ATTGGTATCG ATAAAGAACG 
TCGTCAAGCA GTTTATAAAA AAATCCATTC TACTGTTGTA GATAATGGTG GTAAAATTTA 
CGATATGACT GATAAAGATT ATGAAAAATA TGTTATCAGT GATGCCGTAC ACATCGGTTG 
GAAaGGTtGG GTTTATATGG ATGAGCmAAT TGCGAAACAT ATGAAAGGTG AACCACAACC 
TGAAGTAGAT AAACCTAAAA llTTAAAATAC AAATAGCACA TAACTCAACG ATTTTGATTG 
AGCGTATGTG CTATTTTTAT ATTTTAAATT TCATAGAATA GAATAGTAAT ATGTGCTTGG 
ATATGTGGCA ATAATAAAAT AATTAATCAG ATAAaTAGTA TAAAATAACT TTCCCATCAG 
TCCAATTTGA CAGCGAAAAA AGACAGGTAA TAACTGATTA TAAATAATTC AGTATTCCTG 
TCTTTGTTGT TATTCATAAT ATGTTCTGTT AACTTAATAT CTT 
(2) INFORMATION FOR SEQ ID NO: 606: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1097 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 606: 
GCTnTTATAT TTAAAAAATT TATTnGCGGA TAATTACCTT TATTAAATCC CACCCATTAG 
GAwTaCGAGT AATAGGACTA ATACTGGAAT CACATAATGT AACATAACGT CCCTCCTTTA 
ACTTAATTTT AATTGTAATC AAATTTGACA ATAAGTCAAA raCATTAATAC CTATGATArG 
TATCATTTAT TAACATATGT ATCATATTTT TAATCTTGCG TAATTTTTAT CGTTAACTAT 
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CTTTTGTCAT TTTAATTATG TTAAGATAAT AGTAGTTATA GAAGTTCAAT CTATAGGAGG 360 

CATAGCATGG ATATTCCAAA AATCACGACA TTTTTAATGT TTAATAACCA AGCTGAAGAA 420 

5 

GCTGTTAAAC TATACACAAG CTTATTTGAA GATAGTGAGA TTATAACAAT GGCTAAGTAT 480 

GGTGAAAATG GACCTGGTGA TCCCGGGACT GTACAACACT CAATATTTAC ATTAAATGGA 540 

CAAGTATTCA TGGCGATTGA TGCTAATAGT GGCACAGAAT TACCAATGAA TCCTGCGATT 600 

TCATTATTTG TTACAGTAAA AGATACTATT GAAATGGAAC GACTATTTAA TGGATTAAAA €60 

GATGAAGGTG CCATTTTAAT GCCAAAAACG AATATGCCAC CATACAGAGA GTTTGCTTGG 720 

GTTCAAGATA AGTTTGGAGT AAGTTTTCAA TTAGCATTAC CTGaGTAAAA GGATTCGCAC 780 

AGCtTGgAAT GATAAAGAAA CACTTTTTCT TATGCATGCG TTTTACCTAT GTATTTCTAT 840 

TTTAAGTACA CATTAGCATT TTAGTTTCGC TCATTTTTAA AATCACAAAG ATAATTTGTA 900 

20 

ACTTAAATGA TGATACGTTA TTTAAAAACA CGATACTTCG TTTCAATGAA CGCATTAAAT 960 

AATAAATAAA CACCTCACCA TAAGAAAGGA CTACTTTCTT TTGTGAGGTG TTTatTTGTC 1020 

GACAACTTGA TTATGATTGT TTCATTTTTT GAATAAGTTC ATAATCAGGT GTAGCATACA 1080 

25 

AAGTTrTTTG ATTGTCA 1097 
(2) INFORMATION FOR SZQ ID NO: 607: 

30 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2031 base pairs 

(B) TYPE; nucleic acid 

(C) STRANDEDNESS: dO\lble 

(D) TOPOLOGY: linear 

35 

(xi] SEQUENCE DESCRIPTION: SEQ ID NO: 607: 
GAGGTCTAGC ATGTCTCGTT CAAAAAAATA CTTTTACTTA TCTAGCTTAA TGATTATTTT 60 

40 

AAGCTTTTTC TTTAATACAA ATAACGTTTT CCTAAGTGGA CTTTTTAATT CTTTTATTAA 120 
ATTAATACTT TTCTGCAGTG TTATTAACTC AATTGTACTA ATTTTGTCTA TAATTTTTGC 180 
45 AGATOGTTCA ATTAAATCAC TAAAGCCTGA TGCAGATTGG ATTAGAATTG CGAGTAAAAG 240 
TTTGCCTTGG aTTATTCTAA TTGTTATTTT AGTACATATC TTTTCAATTG TTCGTACATT 300 
CGGTTTTATT TAAAAAAGTT AATATGTCAT TGTAGCCTTA ATACAAAACA ATACAATGTA 360 

SO 

TCATGCTATA ATGAGTAAAA CAATTTGATA ACGTTGTTGC GTATAAAAAA TATTAGATTT 420 
TCGAAATCAT AACTATGCAT CTAATCGCTA TAGTTATACA ACAAGATATA ACATATAATG 480 

AGGTTTGATA ATGCATCGAC AAmTTGTC GTCGCGTTGC CAAAACCTCT TTTTTAAATT 540 
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TTTAGGCGCT TTATTACGTT ACCTCATTTC TTTTCTGAAT ACTGACGGAG GTTTTCCAAT 
CXXSAACACTG ATAGCCAATT TGACTGGTGC CTTTGTAATG GGATTGCTAA CAGCCTTAAC 
AATTGCATTT TTTTCAAACC ATCCGACCCT AAAAAAAGCT ATTACGACTG GTTTTCTTGG 
TGCTTTAACG ACTTTTTCAA CATTTCAATT AGAATTAATA CATATGTTTG ATCATCAACA 
ATTTATAACT TTACTACTAT ATGCTGTAAC AAGTTATGTC TTTGGTATTT TGTTATGTTA 
CGTCGGTATA AAACTAGGTG GTGGTTTATC ATGATATCAA TCATTTTAGT CATGATTGGC 
GGCGGTTTTG GCGCAATTGC TAGAAGTGCC ATTACTGATT ATTTTAATCA TAAATTTACT 
TCAAAGTTAC CTATCGCAAC ATTGATAGTA AATCTAGTTG GTAGTTTTTT AATTGGATTA 
ACTATAGGCT TATCAATTTC AATCTCATGG TTCCCTGCGT TCTTTGTTAC CGGTTTTTTA 
GGTGGCTTAA CAACTTTCTC AACGTTAGCC AAAGAACTTA CACTAATGAT GACGCCAAAA 
TTTAATATTA ACCTTTTTCT CAATTATTCA CTTTTACAAT TCATCATTGG ATTTATAGCT 
TGTTATATTG GCTATCATAT TTAAAAATAA AATGCTTCAT TCAGCAAATA GGTAAATTAC 
GACACCTTCC TGAACGAAGC ATTTTTTAAT TTTCATGCAA ATTTTTAAGC ACCATATAAT 
GCCTACCAAA TTTCAATAAT CTTTGTTGCC GTTTAAATAA TGTGAATGTC AATAAATTCT 
CCAAACTAGT CGAAAATAAA GGGAGTGGGA CATAAATCCC TAAAAAAACA GCAGTAAGAT 
AATTTTCAAT TAGAAAATAT CTTACTGCTG TTCTCTATTT ATACAATACT TCGTATTGAa 
TGGcTTCGCT TTCCTAGGGT GCCGTCTCAG CCTCGGcTTC GACTGGCACT GCTCCCTCAG 
GAGTCTCGCC ATTAATAcTA CGTATTAACA TGTAATTTTA CTTTTACATA CTTTAAAAAA 
TAAGACACTT TGCCCAACTT ACACTACCAA TAGAAACCTC TGTTAGAATT CCTCAAAATG 
ATATTTCGCG ATATGTTAAT GAAATTGTTG AAACGATACC TGATAGCGAA TTCQATGAAT 
TCAGACATCA TCGTGGCGCA ACATCCTATC ATCCAAAAAT GATGTTAAAA ATCATCTTAT 
ATGCATATAC TCAATCTGTA TTTTCTGGTC GAAGAATAGA GAAATTACTT CATGACAGTA 
TTCGAATGAT GTGGTTAGCT CAAAATCAAA CACCTTCTTA TAAAACTATT AATCGTTTTA 
GAGTGAATCC TAATACTGAT GCGTTAATTG AATCTTTATT TATTCAGTTC C 
(2) INFORMATION FOR SEQ ID NO: 608: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 687 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



660 
720 
780 
840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 
1920 
1980 
2031 



55 



1539 



EP 0 786 519 A2 



TCCCCGGGAA TCGAACCCGC GAnCTCCTGC GTGACATGCA GGCGTGTTAA CCGCTACACT 60 

ACGAGACCTA TTAnATTAAA AACTATGTAT TGCX3GGAGGC GGATTTGAAC CACCGACCTT 120 

5 - 

CGGGTTATGA GCCCX5ACGAG CTACCGAACT GCTCCATCCC GCGCTAATAT TATTTTGAAT 180 

TACCTAATTA ATATACCATA ATCAAAAACC TAAAGTsrrG AACTTTTTGA ATTTAATTTA 240 

AATGTTATCT CTTAAATAAT TACTTAAATA TCGTAGCAAC ATGTTCTCTG TTGAACACAA 300 

10 

ATATTAGTAT ATTCATTTTT GTAGTGTACG TCAACGACAT TTTCAAAGTT TTTTGTGTAA 360 
AAAAACGCTT CTTATTCCCT TTTATCATAT AAGTGTCTAA TAGTTGTCAT AAATAGTGkT 420 
15 AAAGCATTTA AAAAGGTATA GGAGTTATAA AGTTTACAAC GCCTATACCT TCTGAAAAAG 480 
AAATTATAAA AGCTTGTTAC ACCGCATATT CTTTCAGTCA GCGACTACCA ATATAACATT 540 
GTAGCCCtAA GACATTGCTT GACGCCTCAn TTACAACAAT TTTTCAAAAT CAGCAGCTAC 600 

20 

CTACTGACAC AACATAACAC AACCCnTACA CTAnCTATCG TGTCATGTAA TCTTGCATCC 660 
GATCTTGCAA CGCTGTAAAT GTTTCGA 687 
(2) INFORMATION FOR SEQ ID NO: 609: 

25 

■ (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 843 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
30 (D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 609: 

35 

GTGTTGAATA CTTTGACAAA ATGAAATCAT TTGTTCTTTC GTTTCAAATT TAACTGTTTG 60 

AATTAAATCA GTTCGTTrTT CGTAGTACTT CGGC6TTGTG TTCATATTCA TTTTTTCTAA 120 

AAATAAACTA GTAAACAATG CACCTTTAAG ACTCTGACTG ACAACGTGTG GTGCTAAAAA 180 

40 

GAAACCTTGA TACATTTCAA GCAATGCATT TAATGATGCA CCCGCTTCTT TACCAATACC 240 

AGGTGCTGTC AATCTATAAC CACATCGTTC AATTAAATCT TTTCTACCAG CAATGTATCC 300 

45 ACCAATCTTA GCTAAACCAC CGCCAGGGTT TTTAATTAAT GATCCTGCTA TTAAATCGGC 360 

ACCACATTCT ATAGGTTCAC GTCTTTCAAC AAATTCCCCA TAACAGTTAT CCACAAATAT 420 

TAAAATATTA GGATGCACGT TTTTCAACCT AGTAATTACC TTTTCAATTT CATCTAGCGG 480 

SO 

AATTGAAGGT CTTTGATCAT AGCCTTTCGA ACGTTGAATC GCTATTACTT TGGTGCGCTC 540 

AGAAACCCCa TCTAACACAC TTTCAATATC GATCTTACCT TCTTTAAGT6 CAATATCTTT 600 

ATACGATmCG CCATGCTCCA TTAAACTTTC AATACCATTT CCGTTTACGC CAATGACTTC 660 

55 
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ACTTTGTAAT GCAATAGTAA TCGCATGCGT ACCTGAAATA ATTTGCGGAC GAACAATTGC 780 

ATCTTCTGCT TTAAATGCCT GCGCATATAT TTCTTAATTG AACGAATTTA GAACTAATCG 840 

TAA 843 
(2) INFORMATION FOR SEQ ID NO: 610: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 775 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

15 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 610: 

GATTATTATA AACCGAATGA AACAAAAAAG TTTTTACATA TTTTCAACAA CTTTATTTCA 60 

ATAAAGCATC AAGTTGATCT AAAGTTTGAT TCATACCTTG TTCAACACCC ATGTTTATGA 120 

CTTGTTGAGC GGCTTCTTTT GTTGGAAATA CCGATGTTGA TGTCACTGTC GTTTTCGTTG 180 

TATTGCTCTT GGAAAATGAC AAAGTAATTT TCATGCTTGG CATTTTTGTA TCTTTTGCAC 240 

CTTGAGGTGT CGCAAATGAG TCAATATATT CAATTAAATA TGGACGCTTA ACCGTTTTAT 300 

ATTCTGCTAA TGTATAGCTG GTCATTGTAG GTGTTTTAAT CGCATAAAAT GCATCACCGC 360 

30 CTGAAACAGC ATTAAAGCGA AACACTTTGG TACTAGCGTC TTTTGGACGA AACCATTTTT 420 

CAAATAATGC TTTkGTCGTA TAGGCATCAA ACACCTTTTC AATCGGTGCT TCTATCGTTC 480 

TTGAAAAAAT AATTTTATTA TCTTCAACTT TAATCGTCAT CTTCCCACTC CCTATCTTTT 540 

ATATTTACTC ATCTTAACAT GCATTGAGTA ACATATGTTA CCAAATCATT TGTTATAAAC 600 

TATAGTAATA TTAATCATTC CCTCTGTnGA AATTGATAAC TACGAAATAA AAAACACACT 660 

CTAnCAGCT ATTAACAGTT GAGTAGAGTG TGCAAACCTG TTGAATTAAT GCGCTAACAT 720 

TTCTTCTTTG ATTTGGTCTT nATnTAATTT TGAAGGATAA TATGTTGGCC AGTTA 775 
(2) INFORMATION FOR SEQ ID NO: 611: 
45 (i> SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 728 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNBSS: double 

(D) TOPOLOGY: linear 

SO 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 611: 
ATCAAAATTT GATACTAAAG GGCTCACGCT ATTTTATGTA TTTATTGGAT TGATTATGTT 60 

55 
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TGTGGCAATG TGTTTATTTA AAGTAGAAAA ACATGTTTCT TCACCATTTT TACCTGTGGT 180 

TGAATTTAAT CGTTCGATTA CTTTAGTTTT TATAACTGAC CTTCTAACAG CTATTTGTTT 240 

AATGGGATTC AATTTATATA TTCCAGTCTA CCTTCAAGAA CAACTAGGAT TATCTCCATT 300 

GCAAAGTGGA TTGGTTATTT TTCCTTTATC TGTAGCTTGG ATTACATTGA ATTTTAATTT 360 

ACaTCX5AATT GAAGCAAAAC TATCAAGGAA AGTTATTTAC TTACTATCAT TTACATTGCT 420 

ACTAGTAAGT AGTATTATCA TTTCATTTGG TATTAAATTG CCGGTACTTA TAGCATTTGT 480 

GTTAATTTTG GCAGGATTAA GTTTTGGATA TATTTATACG AAAGATAGTG TGATTGTCCA 540 

15 AGAGGAAACT AGCCCATTAC AAATGAAGAA AATGATGTCA TTTTATGGAT TAACTAAAAA 600 

TCTTGGGGCA TCAATAGGTT CAACAATAAT GGGATATCTT TATGCGATAC AATCAGGAAT 660 

CTTTGGTCCA AACTTACACA nTGTGTTAAG TGCTGTTGCT GTAATTAGCA TGGGCTTATn 720 

20 

GTTTTATG 728 
(2) INFORMATION FOR SEQ ID NO: 612: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 913 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

30 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 612: 

TATCAGAGCA AATAAGCAAG TTAGATAAAA AGATTTCTGA CTTACAATTA ATTAGACGCT 60 

CTGTATGTGA ATTTATTAAA GGACTCTCTC TAATAGATAC CAGCATTTTA AACAAGACAC 120 

TACAGTCACA ATATGATAAA GAAGCATCTA TAAAATATGG TCATACGAAA GCATATCAnT 180 

CATTTATTAG ACGTAAAGAC AGCTTACAAT CGCAGGATAT CAGACATAAA TTGACAACTA 240 

TCTTCAATAA ATTTAATCAT ATGTCTTTGA GTCATTATCC AATCCAAGAT TGTAGTGATC 300 

TCGTATTTGA GTGGAAGGCA TTTATGAACA CTATCGCTGA TTTTGtnTGAT GAAACATTAT 360 

45 GCTGTATTGC TAAAACATAT GAAGATGATA CGCGTTTCAA AGATTACTTT AATTCATATG 420 

ATAATCAAAA TTTAGCATCA TACATTTCAG AAGCTGTTAA TTATTTTTTG AGCAATGTGA 480 

ATAAGAGCGA CAATTTTTAA TCCTCATACA GATGCTACAA CACTGAATAC ACCAACTAAA 540 

SO 

ATAATTGTTC AAAGTAGAAA ACTAATCATT TATTCTCTAA ATCAATAACT ATATTAAAAG 600 

TTATACCTTT GCAAAGCGAA TTAGTATAGG TTACCGAAAG GAGAAAGGAT TAGGTTCCAT 660 

TCGATTTATA AAAAAATATA TTTCGAAACA TACAAAAGCG CCAGAAGATA ATCATTTCCT 720 

55 
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TCAATGCATA TTCAACTAGC TCAGGTTTAC TCTTTAAGCC AAGCTTTGTC ATAATATGCG 
TCTTATGTGC TTCTACTGTT TTCACAGATA CAAATAATTT CTCTGCAATT tCTTTATTCC 
CGTAACCTTT GGC 

(2) INFORMATION FOR SEQ ID NO; 613: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 654 base pairs 
(3) TYPE: nucleic acid 
(C> STRANDEDNESS : double 
(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 613: 
ACAAGTGTTG ATGTCATAGT AGCGTCAAwT GTGCTTTATT TCTGGGACAC ATTTAAATTT 
TTCCACCCCA TTACTTGGAG CTTAATCTTT ATTACAATTT TACTATTATT AAACATTTTT 
TCTGTAAAAT CATTTGGAGA AACTGAGTTT TGGTTATCAT TGATTAAAGT GTTAACAATT 
ATCGTATTC6 TTATTTTTGG CTTTTTAATG ATTTTCGGTA TCTTAGGTGG TCATACATAT 
6GATTTGAAA ACTATACAAA AGGCCAAGCA CCGTTTGTTG GTGGTATCTC TGGTTTCTTA 
GGCGTATTAT TAGTCGCCGG ATTTTCGGTT GGTGGTACAG AAGTAGTAGC AGTAACTGCT 
GGTGAATCAG ATGACCCTAA AAAGTCTATG CCTAAGGCAA TTAAACAAGT ATTTrGGCGT 
ATTCmTAT TCTATGTCTT ATCAATTGCA GTAATTGGTG CAATTATTCC GTACACAGAT 
CCATCATTAT TAAGAGCAAG TAGTTCAATA AGTCAAAGCC CATTTACAAT TGTATTCGAT 
AGAGtAGgCA TAGCCTTTGC AGCATCAGTA ATCAACGCGG TTATTTTAAC TTCATTATTA 
TCCGCTGCAA ATTCAGGTGT TTATACAACA GGCAGAATGT TGTATTCCTT AAGT 
(2) INFORMATION FOR SEQ ID NO: 614: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 642 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 614: 
TCGATCTTTA TTGATAATAA TTAAATTGTC GCCTTTAAAA TGTGATATTA ATCCTGCGGC 
AGGnTGTACA ACGAGTGATG AACCTAGTAC AACAAGGGTG TCAGCATGTT CAATTTTATT 
TAATGCCCTT ATGATGGTAG GTTGATCTAA CATTTCACCG TATAATACGA TGTCCGGTCG 
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ATAAGATTTA TGACATACAT TACAATAAAA ACGATTTAAC GTGCCATGTA ATTCATCAAC 300 

ATGTTGACTT CCAGCGTCTG AGTGCAAACC ATCGATATTT TGCGTGATGA CACCTAAAGA 360 

5 

TTGTTGATTA CGTTCTAATT TTGCAATCCA ATCATGAACG ATATTGGGCA TCGTATCGAC 420 

AAATAGTAAG CGCTTATGGC AGAAATTGAT AAAACCTTCA GGATCATCTT CTAAATAATC 4 80 

ACGGCTTAAC AAGTATTCTG GCGAAAGCCC ATCTTTTGaA ATTTCATCAA ATAAGCCACC 540 

10 

CATTGaACGG AAATCTGGAA CGCCACTTGC GACAGATACA CCAGCACCTG TAAAAAATGT 600 

AATACGATTC GAACTATCTA TAATATGTTT TAGTGTCTCT AA 642 
1$ (2) INFORMATION FOR SEQ ID NO: 615: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1210 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNES S : double 

(0> TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: i 

25 

TTTCCCCnCC CCnCCAAATA TCCAAnGGAA 
ATGGCATTTT ATAAGTATAA TATATCTGTA 
30 TTTGAAACAT ATTTCACATC AAAATCACAA 

TAATAATTTA TTTAATGAGA AGAGTTGCTT 
CGTTACAAAA CCTATATCTT TAATACGGAA 

35 

CTAAAACTTC TCTATCAGAT TTATTTGTTG 
CATTTAATQG ATAATTTGCT TGCGTAATTT 
CGTCACCTTC AAATTGTACT TTCATATAAT 

40 

TGtCACCCTG TTCCTCAGGA ATTACTTCAA 
ACTTTCCGAG TTGATTGCTT AGCGTAATTA 
4S CATCAATTTG GTCATCCATT CTTGCAGCTG 
CATGCAGTTC AGAGAACTTA TGCTTTACGA 
CAGTTTCACC TGGGAAACCA ACAATTACAT 
TATGCAATTT TGTTAATCGT TCTGAAAATC 
TTAATACTGT ATCTGAACCA GATTGTAATG 
AACGTTCTAA AACGTCAATT ACTTCATCTG 

55 



EQ ID NO: 615: 

CTTTAATAGT CCAATTGGCA CAGTAAAACT 60 

ATTTATGGTC AATTAGTAAA TTGTTTTTTA 120 

AGACTTTTAG ATTTTGtTCT AAAAATCTCT 180 

ATATAGTAAA TTGTGAAGCC GTTAAAACAA 240 

CCATATGGTA TGAATCAAGG AATACTTAAA 300 

CGAAATCAAC AACTTTAATT GCTTGCCCTT 360 

TAACTTTTAC AATTTGACCT ATGAGTGATT 420 

TATCTGCATA TCCAACTAAT GTACCTTCTG 480 

GCACATCTTG ATCAAATTTA GACGCATATA 540 

ACTTATGCAC CCGTTCATTT TTAATTTCTT 600 

GCGTGCCAAT TCTAGGAGAA TAAGGGAAAA 660 

TAAAATCATA TGTTTCTTGG AACTCAGCTT 720 

CACTCGTAAy TGCCAAGTCT GGTAAAGCTT 780 

TATCCATTGT ATACTTACGT CTCATACGTT 840 

GAATATGCAA ATGACGCACA ACTTTTGTTG 900 

TAAGTTGACT TGCTTCAATT GAAGAAATTC 960 
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CTTTTAAATC TTGACCATAT CCACCTGTAT GAATTCCCGT CAATACAATT TCCTTATATC 



1080 



CTGAATTCAC TAGTTGCGTC GCTTGTTCAA CTACTTTTTC CGGATCTCTT GAACGCATTA 



1140 



AGCCACGAGC CCATGGAATA ATAcAGAATG TGCAGAAGTT GTTACAACCT TCTTGAATTT 



1200 



TTAATGACGC 



1210 



10 



15 



20 



25 



30 



^35 



40 



45 



SO 



(2) INFORMATION FOR SEQ ID NO: 616: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH; 652 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEONESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION; SEQ ID NO: 616: 

TAATAAAATA CAATACTTTT CAATACAGAG AATCCCGCAA TGTCGGGATT CTTATTTATG 60 

CTGATTTTGT TTTTGTCTAT GATCAGGGAC TTtCAGGGAC TCAATTAATT ATCACATTCA 120 

TATTTTCTTA TGACCAAATT GATACATATG ATGCTATTTA ATGAGAAAAT TAGGCATCAC 180 

TTGGTTATTG AATTTCCTTC ATTAAACTTT CCAGCTCAAT TTAATAGTTA GTCGACTATT 240 

ATTCATTAAA CACTTTTTAA TCATAAAAAA GTGTTTTTGa TAATTCACTa CCaAAAACAC 300 

CTTCTTACTT ATAATTCTAT TTGTTCACCA TTTCTAATCT TATCGGCTAA ATCATTCAGT 360 

TTTCTTAATC GGTGATTTAC ACCTGATTTT GAAATTGGAC CAGTTGATAC CATTTCTCCA 420 

AGCTCTTTCA ACGAAATTTC TTGATGTTCT ACTCGAATTC TAGCAATCTC TCTCAACCTG 4 80 

TCTGGTAAAT TTTCAATACC AATTTCTTTA TCAATCAATT TAATGCTCTC AACTTGTTTC 540 

ATCGCAGCAC TAACTGTTTT ATTTAGATTG GcCGTTTCAC AATTAACGAG TCGGTTAACA 600 

GAATTACGCA TATCTCTTAC AATACGTACG TCTTCAAATT TTAATAACGC TT 652 
(2) INFORMATION. FOR SEQ ID NO: 617: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 798 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEONESS: double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 617: 
TnACCACTTT AAAATAGCGC TTAATAAAtG AAGGGGGCAA GTCTTATGAC GtTTTACaAT 60 
TTCATCaTGG GTTTTCAAAA TGrTAACACA CCATTTGGTA TATTGGCCGa ACACGTTAGT 120 
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TCTAATTACA CAGATCATCA ATTAATTGAA ACTACAAATA GAGCTATTAG CTTATATATG 
GCAAATTAAT TTGAGTAGTA CCAATTATGA TGTATTAGTG CATCCCAAAT ATCTTTTGTT 
TTAAAGTTTA TTTCATCATT TCTTATCGAA AATGGTGTAA TAATGTCTTT ATCTAACCAA 
GTGTTGATAA GTTCATTTGG TACACCATCT AACAACATTT CACTTTTACT AATTATAAAA 
CATTCCCAGT CAAGTGAAAC ATTTTGTGGA TTCACATAAT TACATTGATT ATGATTATCC 
ATAAACACTC ACTCCTTTAA AATTCTGTAC TCTTCATTGC GTTTTACCCC GTCACATTAT 
CTTTTAAACT AAAATCATCA TTACTTATGA AAAAAATGTA CATCAAAAGC AAAGGTTTTC 
GCTACCGAAA AAGTTTAAAT AATGGTttAA TATATttGGT ACTCATTTTA ATAAAAAGAG 
AATACATTTT GAGCTATCAA TACTTTTTAT TGAAGAGGTG TTATTsyTGG CTAAAACGTT 
ATATTTAATG CGCCACGGAC AAACTTTGTT TAATTTTAAG GGACTAATTc AGGGATTTGG 
AGATTCGCCG CTAACAGA 

(2) INFORMATION FOR SEQ ID NO: 618: 

(i) SEQUENCE CHARACTERISTICS: ' 

(A) LENGTH: 1786 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 618: 



ATACGCTCAA 


TTGATAAAAA 


TTTAATATCT 


GCCATTTGTA 


TACGCATCGC 


TTCGAATGTT 


TCCGTTGCAA 


TATCAAATGA 


TAATTGTGAC . 


TGGAACCTTA 


AACATCGAAT 


CATACGTAAA 


GCATCTTCTT 


GGAATCGTTC 


CTCAGCTATA 


CCTACAGTTC 


TTATTATTCG 


ATTATTAATA 


TCTTGTTGAC 


CATCAAAATA 


ATCATACAAT 


TTGTATGCTG 


TATCCATTGC 


TATCGCATTC 


ATCGTGAAAT 


CTCGTCGTTG 


CAAATCTTCG 


TATAAATCAC 


GAACAAATGT 


AACACCACTT 


GGTCTACGGT 


GATCGACATA ATCTTCTTCA 


GCCCGGAATG 


TTGTCACTTC 


ATAATTTtCA 


TCATtAAAaa 


CTACATTtAT 


CGTGCCAtGT 


yCTTnACCTA CAGGTATCGT ATGACTAAAG 


ATAGATTCTA 


TTTCATCCGG 


CGTTGCACTT 


GTTGTGATAT 


CTATATCATG 


AATATTTCTT 


CCCATGACAT 


AATCTCTTAC 


AGAGCCACCT 


ACATAATATG 


CTTCAAAACC 


ATTGTCTTGA 


ATTTGTTCTA 


ATATAGGCCT 


TGCCTGTTCA 


AATAATGATT 


TATCCATATT 


ATTACTCGCC 


TTTACTTTTG 


TTATGCTCAT 


TTAGCATTTT 


TTGATAATAA 


TACTCATATT 


GATCTGTAAT 


AAGTTCTGAT 


CCAAAACGTT 


CAGCAATATC 


TGCTAGCATG 


TTTTTCTGAA 


GTTTGTTGTA 
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ATCTACGACA AATCCAGTTT CACCATGTTT AATAACCTCT TTAATTCCAC CGGCATTTGA 840 

ACCAATTGGA ACGACGCCTG TwTTCATAGC CTCAAGTAAA GTTAGTCCAA AGCTTTCTTT 900 

5 

TTCACTTAAT AATAATACTA AGTCAGATAA TTGGTAAAAT TCACTTACGC AATCTTGTTT 960 

CCCTAAAAAT AAAACATCCT CTTCTACGTT TAACTCTTTC GTCAATTGAC GCATTGGCAC 1020 

TAATTCAGGA CCATCTCCAA GTAAAATTAA TTTACTAGGT ATCTTTTCAC GTACTTTTGC 1090 

AAATGTTTCT ATAATAGTAT CTATGCGTTT TACTTGTCTA AAATTCGATA CATGTATTAA 1140 

CACTTTTTCA TCTGGTGCTA TACCAAATTG TGATTTTAAT GCTGTGTTAT GTTTAGTTGG 1200 

AAACTCATTT TCACGTACAA AATTATAAAT CGGTATAATT TCTTTGTTAG TTTCAATAAT 1260 

TTCATGTGTT TCTTGTGCTA AAGATTTACT CT^CACTTGTC ACAATATCAC TTTTTTCAAT 1320 

GCCAAATTTA ATTGCACCTT GGAGTGAATG ATCATAGCCC AAAACAGTAA TATCAGTACC 1380 

20 

GTGTAGCGTT GTCATAATTT TTATATCTTT ACCTGACATC TCACGAGCTA AAATCCCACA 1440 

AATTGCATGA GGTACAGCAT AGTGCATATG CAACAAATCA AGATCATATT CTTTAATAAC 1500 

TTCAGCGATT TTAGTACTTA ACGTAATATC ATACGGTGGA TACTGAAATA CTGCATATTG 1560 

25 

ATTCACTTCA ACTTGATGAA AAATCATATT CGGTAATGGT TTTCTTATTC TAAACGGGAT 1620 

ATTTGAAGTG ATAAAATGTA cTTCGTGACC TCGCTCTGCT AATTTAATTC CTAATTCTGT 1680 

30 GGCAATAATT CCAGAACCAC CCATGGACGG 6TAACATGTT ATACCTATCn TCATTCGCTT 1740 

GCCCATCCTT TCTTTCTATT TCTCnCTATG ATnCTCGATG CGTAGA 1786 
(2) INFORMATION FOR SEQ ID NO: 619: 
(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 844 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

40 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 619: 

45 ACAGGTATGG ACTTnGCTCA AATGACACGA CATTATTTAT CAAGACCTAT TGCTATAATC 60 

TTTTGGATCA TTGCAGAACT AGCAATTATC GCTACAGATA TTGCTGAGGT TATTGGTAGT 120 

GCTATTGCTC TTAATCTCCT ATTTAACATA CCTTTAATCG TCGGTGCACT AATAACTGTA 180 

SO 

CTTGATGTAT TTTTACTACT TTTTATAATG AAATATGGTT TTAGAAAAAT TGAAGCTATT 240 

GTTGGTACAT TAATTTTCAC AGTGTTATTC ATCTTTATAT TTGAAGTCTA TATTTCATCA 300 

CCACAGTTGA ATGCTGTGTT AAATGGATTT ATACCACATA GTGAAATCAT TACAAATAAC 360 

55 
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TTACATTCAT CAATTGTACA ATCTAGAACA TACTCAAGAC ATAACAATGA AGAAAAAGCG 480 

CAAGGaTTAA ATTTGCTACG ATAGATTCGA ACATTCAGTT ATCAATCGCA TTTGTAGTCA 540 

ATTGCTTATT ATTAGTGtTA GGAGCATCAC TATTTTkCAA CTCAAATGCT GACGATTTAG 600 

GTGGTTTCTA TGATTTATAT CACGCCTTAA AAACTGAACC TGTACTAGGT GCAACAATGG .660 

GTGCAATCAT GAGTACATTA TTTGCAGTTG CATTATTAGC GTCAGGTCAA AATTCAACGA 720 

TTACTGGTAC TTTAGCAGGA CAAATTGTAA TGGAAGGATT TTTAAGATTA CACATACCAA 780 

ATTGGTTAAG ACGTTTAATT ACACGTTCTC TTGCTGTCAT TCCTGTTATC GTATGCTTAA 840 

75 TCAT 

(2) INFORMATION FOR SEQ ID NO: 620: 
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20 



25 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 574 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



. (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 620: 



(2) INFORMATION FOR SEQ ID NO: 621: 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 523 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



844 



TGTATTGCAG 


TCATGCCATA 


AATTTTTTGA 


ATAATAAACG 


GAGACGCAGA AATATAAGTA 


60 


AATAATATTA 


CAAATGTCAT 


ACCTTGGAAT 


GAGCATTGGT 


AATACAAAAC 


GTGGCGTCXT 


120 


CAnTAATATT 


TTGAAGTTTT 


TAAACATTGT 


CTTrAaTCCA 


CTACTTGACT 


CACGATTTGT 


180 


CACTGTTAAT 


GATTCAGGTA 


CTTTTAATAA 


AGAACCTATG 


ACCATGACGA 


AGCCAAAGAT 


240 


AGTCAGAATG 


ACAAAGACCA 


TACGCCAGAC 


AGAATAATTT 


AAAATTATGC 


CCCCTATTGT 


500 


TGGCGCAACA 


ACTGGTGCAA 


TACCATTAAC 


AAGCATCAAT 


AATGCCATAA 


ACTTAGTTAG 


360 


TTCATTACCA 


CTATACATAT 


CACTTGCTAT 


AGCTCTTGAA 


ATAACTGCTG 


tGCGCCACCT 


420 


GTCACTCCTT 


GAAGaAATCT 


TAATGCAACC 


ATCAGCCAAA 


TATTATGTAC 


AAAAACAATA 


480 


CCTAAACTTG 


CTAATGTAAA 


AATAATCATA 


GCTATAATAA 


GCGGCTTTCT 


GCGCCCAGTT 


540 


GAATCTGAAA 


TTGGACnAGC 


AACCAAATTA 


CCAA 






574 



55 
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5 



AAGCAAGAGA GAGTACAACA TTTATATGAT ATTAAAGACT TACATCGATA CTACTCATCA 60 
GAAAGTTTTG AATTCAGTAA TATTAGTGGT AAGGTTGAAA ATTATAACGG TTCTAACGTT 120 
GTACGCTTXA ACCAAGAAAA TCAAAATCAC CAATTATTCT TATTAGGTAA AGATAAAGAG 180 
AAATATAAAG AAGGCATTGA AGGCAAAGAT GTCTTTGTGG TAAAAGAATT AATTGATCCA 240 
10 AACGGTAGAT TATCTACTGT TGGTGGTGTG ACTAAGAAAA ATAACAAATC TTCTGAAACT 300 
AATACACATT TATTTGTTAA TAAAGTGTAT GGCGGAAATT TAGATGCATC AATTGACTCA 360 
TTTTCAATTA ATAAAGAAGA AGTTTCACTG AAAGAACTTG aTTTCAAAAT TAGACAACAT 420 
TTAGTTAAAA ATTATGGTTT ATATAAAGGT ACGACTAAAT ACGGTAAGaT CACTATCAAT 480 
TTGAAAGATG GAGAAAAGCA AGAAATTGAT TTAGGTGATA AAT 523 
C2) INFORMATION FOR SEQ ID NO: 622: 

20 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1871 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 
2s (D) TOPOLOGY: linear 



75 
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(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 622: 



55 



AGAAGTGTGA 


nAAAAATTTA 


AnAGAGATAT 


GCACATAGAT 


GACGCATTGC 


TATATCCAAG 


60 


CAATTGAGAA 


AGCTGCTGAT 


GCTCCAAATC 


aCGGAATGAG 


GGAACCATGG 


AGAGTTGTGC 


120 


ATGTTCCGAA 


AGACAGATTA 


GGAGATATGA 


GTAAGGATAT 


TTCTAAATTT 


GCATTTCCTA 


180 


ATGAATTAGA 


TAAGCAACAA 


TGTCATTATG 


ATGCAGTTAC 


GAAACTAGGT 


GGCATGTTAT 


240 


TGCTTATTTT 


AAAAACAGAT 


CCAAGACAAC 


GTCAAAATGA 


TGAAAACTAC 


TTTGCATTTG 


300 


tGCATATGCA 


CAAAATCTTA 


TGTTGTTACT 


TTATGAAGCG 


GGAATAGGTA 


CATGTTGGAA 


360 


aTCGCCATTA 


TATATCTATG 


ATCCTAAAGT 


AAGnAAACAC 


TTGGTATAAA 


GnAAGATGAA 


420 


GTTCTTGCTG 


GATTCTXATA 


TTTAACGGAT 


TTAGAAGnAG 


ATATGCCTAA 


AGCACCACGT 


480 


AAAAATAGAA 


ACTTAATTAC 


ATTATATTAA 


TATGTATAAT 


TATAGAAACA 


TTAATAAAAG 


540 


CTGAGTCATG 


AATTGATGGA 


CATCTATCGA 


GTTAGAGATT 


TAATCTAACT 


TACTAGAGTC 


600 


GGTACAATAA 


CAGTCTCAGC 


TTTTTATTGT 


GCAGTATATA 


CACATTTTTA 


TrrTAGTATT 


660 


TATTtAAAAG 


TTtCTGCTaA 


AAATGATTCA ACTTGTTCAG 


GTGACTTAGC 


ATTTGCTGAA 


720 


TGAAGGTGTG 


CAATTTTATC 


GCCGTTTTTA 


AATACTAGCA 


AGCTAGGGAT 


ACCCATAACT 


780 


TCATTTTCAA 


CAACTACATC 


TTCTAATTCA TCACGATTAA 


CAGTATACCA 


TTGGTAATCA 


840 
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5 



10 



CCTGCCTCAA ATTTAACAAT TACAGGTGTA TCGCTATTAA TTACAGATTT AAATGATTCA 960 

TTACTTTTGA TTGATTGCAT TGTAACAACT CCTCTAGATA GTTTAATAAT TTTTATTATA 1020 

GCTAAATTTA TATCATAATA AAAAATTTTA GCTTCAAAAT GAAAGCCTTT TGCTTTGGAA 1080 

AATGATATAT TTATTTTAAA TACATAAAGG AGGTTGCAGT CGTATGATTA AATTTTACCA 1140 

ATATAAGAAT TGTACAACTT GTAAAAAGGC AGCAAAGTTT TTAGATGAAT aXGGCGTAAG 1200 

TTATGAACCA ATTGATATCG nCAACATAC ACCTACAATA AATGAATTTA AAACAATAAT 1260 

TGCAAATACA GGCGTAGAAA TTAATAAATT GTTTAATACA CACGGCGCGA AATATCGTGA 1320 

GCTTGATTTG AAAAATAAAT TACAAACTTT ATCAGATGAT GAAAAGTTAG AGTTGTTATC 1380 

ATCTGATGGT ATGTTAGTAA AGCGTCCTCT AGCAGTAATG GGCGATAAGA TAACATTAGG 1440 

ATTTAAAGAA GATCAATATA AAGAGACTTG GTTAGCGTAA GTGaAATGTA AGCGTTTACT 1500 

AAATATCTCG ATATTTAGAT TCATTACATG TAAAATGAAA TAAGCTATAC AATTGTTAAT 1560 

TTTTATAAAT ATAGTTGAAT AGCATCTAGC CTTATGGCAT CATTAATGAT GTAAAGATTA 1.620 

ATTAGGAGGG GATTCTCTTG GCAGTACCAA ATGAAyTGAA ATATTCAAAA GAGCATGAAT 1680 

GGGTJAAAGT TGAAGGTAAT GTAGCAATAA TTGGAATCAC AGAATACGCA CAAAGCGAGT 1740 

TAGGTGATAT TGTTTTCGTT GAATTACCAG AAACAGATGA TGAAATTAAT GAAGGGGATA 1800 

30 CGTTTGGTAG CGTAGAATCA GTTAAAACTG TATCAGAATT ATATGCACCA ATCTCTGGTA 1860 

AAGTAGTTnA A ^^"^^ 
(2) INFORMATION FOR SEQ ID NO: 623: 



20 



2S 



35 



40 



SO 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 451 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 623: 

45 TTGCTGTAGA AGATAAAGAG TCCCATCAAT GGATAGGCTT TATAGGTTTG AATTATATTC 60 

CAGAAACAAG CGATTATCCA TTTAAAGAAT TACCGCTTTA TGAAATAGGT TGGCGCTTGT 120 

TGCCAGAATT TTGGGGAAAA GGATTAGCAA CTGAAGGCGC AAAGGCAACA TTGAAGTTAG 180 

CAGAAGAACA TCAAATATAC GATGTCTATA GTTTTACAGC AGAAGCAAAT AAAGCTTCAC 240 

AACGTGTAAT GGAAAAAATT GGCATGACAG TGTATGATCA TTTCGAATTA CCCAATCTAA 3 00 

GTAAGTATCA TTTATTaAAA AGGcAAGTGC GCTATTACAT TAATCTTCcG AAAGTGGAAA 360 



55 
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ATTAgGGGGT GtTTnGTkTn ATTTTTTTAA n 
(2) INFORMATION FOR SEQ ID NO: 624: 
(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 665 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 624: 
CGATAGTTAT CTAAAGCCAT TTTnGATTGT GTTATGAAAT CTAATGATGC GTGATAATTT 
AATGCrACAT AACGrTaATA TAAAATATCA ATAGTGAACA TTTGAGCAAA TAATGAAGTT 
GTTGCTCCCA TATGCATCTC ATTTTCATCA GTTTTCCCAT AAGTTAAAAC AATATTTGAT 
GCCTGTGCTA CGGGATTATC CCTTGTACTA GTAATTGTAA TTATAGGTAT ATGGTAGTCA 
TCAATAACTT TAACCATTGA TTGCATTTCA CTTTGCGTAC CATTGTTAGT AATAAGAATA 
aCACTGTCGT TCGAATTGTG AGTTGCTAAT AATGTAGCAA AAATATGTGT TTCTTGAACA 
AGTTGAATAT TAAGACCTAT TCTTGATAAC TTTTGGTATA AGTCGGTAGC AACTACAAAA 
GATGCGCCAA AACCATATAT AAAAATCGTC TCAGAACGTT TTAAACAATG ACATATTTGA 
TCAATAGTTT TATCATTTAA TTCGTTATTT GCATGATTAA GTGCGCGTGT AGTACGTGTA 
TGGAGTTTAG TTCTTAAAGA TTCTGTGCTT TCGTTATTCA TTAATTCAAC ATTGTAAATT 
GATGATGCTT TAGGAACATA TTTAGATATA TTTATTTTCA AGTCGTGAAA ACCGCCATCA 
GTAAT 

(2) INFORMATION FOR SEQ ID NO: 625: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2549 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 625: 
GATGCCAATT AACCGTGCAT ATAATGTTGA GAAGTTAATC GAAGCAATTC AATATTATCA 
AGAAAAAACA AATCGTCGTG TTACTTTTGA ATATGGTCTG TTTGGTGGTG TGAATGACCA 
ACTAGAACAT GCAAGAGAAT TAGCACATTT AwTAAAAGGC TTAAACTGCC ATGTTAACTT 
AATTCCtGTC AACCATGTTC CAGAAAGAAA TTATGTGAAA ACGGCTAAAA ATGATATCTT 
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TTCGGATATT GACGCAGCTT GTGGTCAATT AAGAGCAAAG GAACGACAAG TAGAAACGAG 360 

GTAAAGACAA ATGCTAGAGG CACAATTTTT TACTGATACT GGACAACATA GAGATAAGAA 420 

TGAAGATGCG GGTGGTATTT TTTATAATCA AACTAATCAA CAACTTTTAG TTCTGTGTGA 4 80 

TGGTATGGGT GGCCATAAAG CAGGAGAAGT TGCAAGTAAA TTTGTTACAG ATGAGTTGAA 54 0 

ATCyCGTTTT GAAGCGGAAA ATCTTATAGA ACAACATCAA GCTGAAAATT GGTTGCGTAA 600 

TAATATAAAA GATATAAATT TTCAGTTATA TCACTATGCA CAAGAAAATG CAGAATATAA 660 

AGGTATGGGT ACAACATGTG TTTGTGCACT TG T T TT TGAA AAATCAGTTG TGATAGCAAA 720 

TGTCGGTGAT TCTAGAGCCT ATGTTATTAA TAGTCGACAA ATTGAACAAA TTACTAGTGA 780 

TCACTCATTT GTTAATCATC TTGTTTTAAC GGGTCAAATT ACGCCGGAAG AAGCATTTAC 840 

ACATCCACAA CGTAATATTA TTACGAAGGT GATGGGCACA GATAAACGTG TGAGTCCAGA 900 

20 TTTGTTTATT AAGCGATTAA ATTTTTATGA TTATTTATTA TTAAATTCAG ATGGATTAAC 960 

TGATTATGTT AAAGACAATG AAATTAAGCG TTTGTTAGTA AAAGAAGGTA CAATAGAAGA 1020 

TCATGGTGAT CAATTAATGC AATTGGCATT AGATAACCAT TCGAAAGATA ACGTTACTTT 1080 

CATACTCGCG GCTATTGAAG GTGATAAAGT ATGATAGGTA AAATAATAAA TGAACGATAT X140 

AAAATTGTAG ATAAGCTTGG CGGCGGTGGC ATGAGTACCG TTTATCTTGC TGAAGATACG 1200 

ATACTTAACA TTAAAGTTGC AATTAAGGCG ATTTTTATAC CACCTAGAGA AAAAGAAGAA 1260 

ACATTAAAAC GTTTTGAACG AGAAGTACAT AACTCATCAC AGCTATCACA TCAAAATATA 1320 

GTAAGTATGA TCGATGTTGA TGAAGAAGAT GACTGTTACT ACTTAGTAAT GGAATATAXC 1380 

3^ GAAGGTCCGA CTTTGTCTGA GTATATTGAA AGTCATGGGC CATTAAGTGT TGACACAGCG 144 0 

ATTAATTTTA CGAATCAAAT ATTGGATGGC ATTAAACATG CGCATGATAT GCGTATTGTA 1500 

CATAGAGATA TTAAGCCACA AAATATATTA ATTGACAGCA ATAAAACGTT GAAAATATTT 1560 

40 GATTTTGGAA TTGCTAAAGC TTTAAGTGAG ACGTCTTTAA CTCAGACTAA TCATGTGTTA 1620 

GGTACTGTGC AGTACTTTTC GCCAGAACAA GCAAAAGGTG AGGCAACGGA TGAATGTACA 1680 

GATATTTATT CTATAGGTAT kGTGTTATAT GAAaTGCTTG TTGGTGAACC ACCCTTTAAT 1740 

GGAGAAACTG CAGTTAGCAT TGCGATTAAA CATATTCAGG ATTCTGTGCC AAATGTGACA 1800 

ACAGATGTAC GTAAGGATAT TCCGCAATCT TTAAGTAATG TCATTTTACG CGCTACAGAA 1860 

AAAGACnAAG CGAATCGTTA CAAAACAATT CAAGAAATGA AAGATGATTT GAGTAGTGTT 1920 

TTACATGAAA ATCGAGCGAA TGAAGATGTC TATGAACTCG ATAAAATGAA AACGATAGCG 1980 

GTACCTTTGA AAAAAGAAGA TCTAGCAAAG CATATTAGTG AACATAAGTC GAATCAACCT 204 0 
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AGCCAGAAGG TACGGTGTAC GAACCAAAAC CTAAAAAGAA ATCAACACGA AAGATTGTGC 2160 

TCTTATCACT AATCTTTTCG TTGTTAATGA TTGCACTTGT TTCTTTTGTG GCAATGGCAA 2220 

TGTTTGGTAA TAAATACGAA GAGaCACCTG ATGTAATCGG GAAATCTGTA AAAGAAGCAG 2280 

AGCAAATATT CAATAAAAAC AACCTGAAAT TGGGTAAAAT TTCTAGAAGT TATAGTGATA 2340 

AATATCCTGA AAATGAAATT ATTAAGACAA CTCCTAATAC TGGTGAACGT GTTGAACGTG 24 00 

GTGACAGTGT TGATGTTGTT ATATCAAAGG GCCCTGAAAA GGTTAAAATG CCAAATGTCA 24 SO 

TTGGTTTACC TAAGGAGGAA GCCTTGCAGA AATTAAAATC GTTAGGTCTT AAAGATGTTA 2520 

CGATTGAAAA. AGTATATAAT AATCAAGCG 2549 
(2) INFORMATION FOR SEQ ID NO: 626: 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2286 base pairs 
20 (B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 626: 



TGCTTACTTC 


GCCTTCAATA 


CGTACTAATT 


TATGATATGT 


GACAGCATCC 


TCAGGTCTAC 


TGATGTCACC 


TGCTTTTTTC 


ACTACAACAC 


TTAAATCCTC 


ATTGTGCAAA 


GATGCTCTTG 


CTAAAATAGC 


AGTAGGTGTG 


ACTACACCTG 


ATTTAGTTAC 


TACTTCCTCA 


GCTGGAAATT 


GTGTGAATCC 


CATCTCATCC 


TGTTGATCTA 


TATCATAAGG 


TAATGACTCT 


CTTTGGCTTG 


CGATATTATT 


TACACGCGCT 


CTATTTTTAT 


CTAATGCTTC 


ACTTTGCGAA 


CGCGCATTGA 


ATACGCTTAG 


CTTTCGTTTT 


GCCGTTAATT 


CAGCGTTTCT 


TGGATTnGCA 


AATAACTGCT 


GTAAAAATGA 


ACGTCTCGGC 


ATATATGCTT 


TCATTTTCAA 


AGGTATCGCA 


TGAATTGTTT 


TTCCATCACC 


ACGTGTTAAA 


CCTTGaACGA 



60 
120 
ISO 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
840 
900 
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GTTGGTCGAA TTTTCTCAAA TCATCCTCAT TAAATGCATT CCCTAAACTT AACATTGGCG 1020 

TGTCATGGTT GACTTTATTG AAAGAGGCTT GGGCTTCACC GCCAACTCTA ACTGTTGGAG 1030 

AATCTACAGT CTTATACTCA GGATGCTCCT CTTCTATTTT AATCAGTTCA TGAAGTAATT 1140 

TGTCATATTC ACTATCTGGT ACAGATGGA.T TATCCTCTAC ATAGTATTCA TAACTGTATT 1200 

GATTTAATAA ATCATGTAAC TCGTTCACAC GAGACGATAA ATCAGCCATC CCTTAATCCT 1260 

CCTTTTTTtC AATTGGTGCA AATTGCGCTA ACAAACGTTT TGGCCCTTGT GATTTAAAGA 1320 

TAATATCTAG TTCGATTGAG CCATTTTTCT CGTTTACATT ACTCACCATG CCTTCTCCCC 1380 

AGGCTTTATG CATCACTTTG TCACCTACAT TCCAATCAGA TGACAATACT TGTTTTTTCG 1440 

TTGACGTTGT TCGTTGACTA AATCCGCGTT TAGCAAAAGG TTTTGCCTTA GGTTGTATCG 1500 

TTTGTCGTTT GCCACTTGAA TGATTTTCTA ATAGTGATTC TGGAATTTCC TTTAAAAATC 15 SO 

20 TGGATGGCAT ATTTGACTGA GGGCGACCAA ATAACATTCT TGATGTCGCA TGAGTGATAT 1620 

ATAACACCTC TTCAGCCCTT GTAATTGCTA CATAACAAAT ACGACGTTCT TCTTGCATTT 1680 

CATGATCATC TTCACTCTTA ATCGCTCTAA TATGTGGGAA TAAAGATTCT TCCATCCCCA 1740 

TTATAAAGAC AATTGGAAAT TCAAGGCCCT TAGCCGAGTG CATCGTCATT AGTGTTACGC 1800 

CATTTTCAGT ATCTGCCTCA TCAATATCAG CTACTAACGA TAAATCCGTT AAAAAGTTAA 1860 

TTAATGACTG TTCTTCTAAT GGGGTATTTT CCTCATAGTC TTTTGGTACT GACATAAATT 1920 

CATCGATGTT TTCTAATCTA CTTCXSAGATT CTAATGTATT TTCACGTTCA AGCATTTCTC 1980 

GATAGCCAGA CTTTTGTAAT ACTTCATCAA CTATTTCATG AATTTCTAAA AATTCTTGTT 2040 

35 CTTTTATCAA GCTTTGGATT AACTCGTAAA AATTAAGACA CTCTTGTGTC ACCTTTTTTG 2100 

aCAATCCGAT AAAATCAGCT TCTCCAAGTG CATCAAACAT ACTGATATTG TTTTGAAGTG 2160 

CATAGTTTTG AACTTTTTCA ACAGATGAAG GACCTACACC TCTTTTTGGA ACATTaATAA 2220 

TACGTTGCAA ACTAATGTCA TCATTACTAT TGGCAATTAT ACG(;:AAATAA CTTAATAAAT 2230 

CTTTGA 2286 
(2) INFORMATION FOR SEQ ID NO: 627: 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 400 base pairs 
(3) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



Ui) SEQUENCE DESCRIPTION; SEQ ID NO: 627 
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TGACATTAAA AGTTGGGTGA AnAAACAAGG CATACTTTAG TTAAGCTTGA TGAAAATAAC 120 

AATGGAATTA ATGCGATTAT TCAAAAAGAA AAAGCAAAAG ATTTAGATAT AAATTATTCT 180 

^ GCTAAAGGTA CTACCAATTG TATTATTTAG TGGAGAATTA GACAAGCTGT AGCAGCGTTG 240 

ATTATTGCCA ATGGTGCTAG AGCTGCTGGA AAAGATGTAA CTACCTCCTT ACTTTTTGGG 300 

GGCTTATGCC nTTAAAAAAG TGCCACCGTT AATGTTAAAA GCAGTTGCCA AAATGTTTGA 360 

10 

TTnATGTTGC CCCAAAAGAT TTACGATGCC CCTTCCCAAA 400 

(2) INFORMATIOII FOR SEQ ID NO: 628: 

Ci) SEQUENCE. CHARACTERISTICS: 

(A) LENGTH: 453 base pairs 
{B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

20 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 628: 
AATAATTTGG GCGCTnXTTG CGTCGGGATA TTATACCGCT TCCTTAATTG TTCAACATTG 60 
TAATCACTGT TTTTCAATTG ATATTTTGCA GAGTAAATTG GTACTTCTGG GTTATATGAC 120 
ACTTCGTCCT CTTTATAGTT TTCCAATTCT TTGAAATTCC CGTATTGTAC AAAGAAGTTA 180 
• AATTCTTCGA TTTCTTTTTT TACTTTTTCG TCATCGATTG GTTTTAATGG AATCATTTTA 240 

30 

TTAkTTTCCA TTTTCACAGG ATATCTTTTT GTATGATTGT GTGTCATTCC ATCGCTATCT 300 
TCAACAACTT CTCTAACAAT ATAATGCCCT TTAGCCGTTC TAGTATTTCT GTTAATTTCT 360 
AAAACTGCTC CTCTrGATTC CAGATTTTCT CCTTTTAATT GGATTTTCAT TTCAGATCTA 4 20 

ATTAGcCAAG TACCTTTATC ATCTtTTTTA AAT 453 
(2) INFORMATION FOR SEQ ID NO: 629: 

40 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1221 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

( D ) TOPOLOGY : 1 inear 

4S 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 629: 
TCATATGCAT TTGCAAAATA AACGCCAGAA GCAAGGTTTA GAATTGGGCC GTCCGTTTTG 60 

SO 

CTCAaTTCAC TTGCATTCAA TAATTCATGC TGATCATGAT CAATTTGCTT ATCTAATTCT 120 
GCaATTTTCT TCATTTGCTT ATCTGATTTG TTTTCTTTCG CCATCATTTG ATCACGACGA 180 
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GCTAATGGTA CTAATACTTT ATCTCCATAT GTGTCAATAA AGTTATAAAA ATAATCATCT 
GTTTTTGATA CAAATCCAGC ACGCTCTTCA GTTTCACGAT ATAAATCTAA GAAAAGATTG 
AACTCATCAC GTTCAAGGAA TCTGACTTTA ACACCATAGT TTATCGCTTT ATTAATATTA 
CGTTTACGTT GACTATCAAA TGTCTTTTTC AATGTTTCGG GTGTTTTACC TTCAAGGTTT 
AATACGCCCA TCCATCGTAC TTGGCTCGAT GTATCATACT CAGTTGTAAA GCCATGATGC 
TCGTAACCAT GTGATTTAAA CAAGTTTACT AGGGCATCAT TTTTCTCGCG ACCTTCAAAT 
GGCACGATAT CTTTATCATA TAGATGATAT AACCAATACG GATCTAATTT AACATATAAA 
CATTGATGTT GCTGTAAATA TTTATCTAAC TCTTTTAAAT AATAATCAAC TAATCCTAAA 
TCTGAAAAAT CCATTACTGG ACCACGATTC GAATAGTAAA CATAACTTCX: CATAGTAGGA 
ATTTTAGAGA AAAGGCTTGC TGCAATTACT TTGTTATTGT CGTCTTTAAT ACCTAATAAA 
ACTACTTCAA AGCCATCATT CTCACGGGTA ACTATATTTT CTTTTACTTG GAAATAATGA 
CTTTCCAATG ATGGATTTTG TACAAAGTTG TCAAATTCGG TAACAGTTAA CTCTGTAAAT 
TTCATGTTTT GATAATTCCt TCCTAAAAAA TTCTGTCTTT AACTTTTTTA AGTGCGGTAT 
ATGCTGCGTA AACAGGTTTA TTAATTGGTT TAATAAAGTC ACCAACATAT TCmATAATTT 
CAGCATTGTA ACCTTTTTTG AATTTAACTA CACCAGCATC TTCAGCATCT TCTGTAAATT 
TrCCACTAAC ACCATAGAAA TTATAACGGT CAATGCATGA TTTAATGCAT AATTAATCAT 
TTCCCATTGC ACTGCATAAC T 
(2) INFORMATION FOR SEQ ID NO: 630: 
(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1121 base pairs 

(B) TYPE: nucleic acid 

(C) STHANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION; SEQ ID NO: 630: 
TGGCCCAAnT AACACAAGTA ATTGCTGCTA ATGGTAACAT CACAAAAAAT GAAATCGTAA 
CTACAAATGT TAAACCTTGG AATACACCAA CCATTTCTGG TAATCGTTTA CTATAGTATC 
TATTGTGAAT CCAAGTAATA ATAGCTGAAA TAATAATACC ACCTAGAATA TTCGTATCCA 
ATGTGGCAAT ACCTGCAATT GATTTTAAAC CAGGTACATT TTCAACGCCT TTTTCTAAAT 
TAGCGCCAAA CGTATGTGGC CATTGTGTTA AAATGGCATT TATAAATGTA TTAAACATTA 
AGTAACCCAT CAATGCTGCA AGTGCTGCAT GACCTGGTGC TTTTTTAGCT AAAGAAAGTG 
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TTACTGACCA AAATTTAAAC CAAAACGTAT GTTGATCTGC TAAACTCCCC ATGATTGTAG 480 

GATTTTTAAA TAATGTCGCA AAGCCAAGCA CTATCCCAAA GAAAGCGAAC ATTAATACCG 540 

GTACAATCAT TGCACTACCG AAACGCTTTA TCGCATTCAT CTTCTATTCC CTCCATATCA 600 

TCTTTCCTAA CAATACATCT AATTAGATTC ATTTATAAAT AGATGTCTTA CTATTTAAAT 660 

ATAATATATA GTAAACGCTT ACACACCTAC AACGACATTG ACGTATTTTG AAAGTATTTT 720 

GTATAATCAG ATTATCTTTT CATATAGTGA AAATTTTTTC ACGACCTTAT ATATGACATC 780 

GTTGTA1TTG TAATACATTC GTTTTAAACG CATAATCAAA CCTATATCAA TACACAAATA 840 

TATATAATGA. CATACAAGAT TTTAATGTAA TAACGATCTA TTACACATTT ATTTTCAAGG 900 

AGGTTGAATA TGTTTTTAGA TGAACACATT AATCGAAACT TTGATAAACT TAATGATAAT 950 

GATTTACATA TCGCTCACTT TATCAATACA CATATAGATG AATGTAAAAA TATGAAAATA 1020 

20 CAAGATTTAG CGCAATTCAC ACATGCCTCG AATGCAACCA TTCACAGATT TACACGCAAA 1080 

TnAGGTTTTG ACGGTnATAG TGGATTTAAA TCGTACCTTA A 1121 
(2) INFORMATION FOR SEQ ID NO: 631: 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4005 base pairs 
• (B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 631: 



TACAAATCTC 


TTCATTAATA 


60 


GATAATCTTC 


TACAAGTTGT 


120 


ATTGAATATT 


GGGATGTTTT 


180 


GTTTATTTTC 


AACGAGGCGA 


240 


CAAATTGATA 


CTITAAATTT 


300 


TTTCAATATA 


TTGTGAAATA 


360 


AACGTGTTAA 


ATTATTAAAC 


420 


ATAAATGTGT 


ACTATGGAGC 


430 


CATTTCCTAA 


TTCATGAGGA 


540 


GGAGAAAATA 


TTGAACTAAT 


600 


TTAAGATAAC 


CTTTGTGAGC 


660 
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TAGTAATTTT CGAGTACAAT CCGTTGTCCT 
CCTCTTCCAT CATACAATTC GCGTTTTACT 

5 

TAATTTAATT GATGATACTG TTTATCTAAA 
TCATATATTC TGACATCATT TGAATTTTCC 
TCCCAATACT GTATCCAGTT AACTTGCTTT 

10 

TAGTCATACA TTGTAAATAC ATCATTTTCA 
TAAGGATTCC ATTTAACATA TACACATTTT 
AATCTATTTA TTTGCGCTTT TTCTACACCT 
ATGTAATTCA TATTATCGCC TCATATAAGT 
ATGAAAAATA CATCTATTGC ATGTGTAATT 
CATATTGTAT TATTTGTTTT GTTTTTTGCG 
TGCAAATAAT CCACCAAATA ACGTTGCGTT 

TGGTAATGCT TTTGCTTTAT TGTGATGGTC 

25 

ATGTTTTCCT GCATCCGAGT CTGAATCGCT 

ATCAGAGTCT GAGTCGCTGT CCGAATCTGA 

ATCTGAATCA CTGTCTGAGT CTGAGTCGCT 

30 

GTCGCTATCT GAGTCTGAAT CGCTGTCTGA 
ATCTGAATCT GAGTCGCTGT CTGAGTCTGA 

35 GTCCGAATCG CTATCTGAAT CTGAGTCGCT 
GTCGCTATCT GAGTCTGAAT CGCTGTCCGA 
GTCTGAATCT GAATCACTGT CTGAGTCTGA 

^0 GTCACTATCT GAGTCTGAAT CGCTGTCTGA 
TGTGAAATCA TCATGATCCG TAATTGTTAC 
ATCTTCAGTT GTATTTGTAA CTGTTTGTGT 

45 

GTATTTACCG CTATCTAAAT TATCAAAGCA 
TCCAATTACT TCGCCTTTTT CATTTAATAA 
AGTTGAATCT TGTTTGCCGT CTTTATTACT 

so 

TTTTGGTGTT TTATAGAAAC CACTGTCTAA 
TGTTGTTGTT AAACCATTAG AATCTTTTTC 

55 



TCACCTAAAA TTCGAGAACA ACTTAAAAAG 780 

TTTCTTCTTT TATGATCAAA ATAATTCACA 840 

AAATGAGCAT ACATTACAAA TTGCTCTTCA 900 

ACAAATTTCA ATGTGTACCT ACATGACTTT 960 

GTCTTTTTAT AATTGATTGC TTTTTGAAAA 1020 

ATCTGATGTT GCTTCGCATA TGTGTATGAA 1080 

GAAGATATGC CGTGTTGTTT GAACAACTTC 1140 

GTAATTTTAC TTTCTAAAAT TGTTCCTAAA 1200 

TTTATTCCGT ATCTTTATTG TTTATTTTAT 1260 

ATAAAAAAAC CAGGCCACAA GGACCTGGGT 1320 

ACGACCGAAT AACAATAATG AACCTAATGC 1380 

ATTTGAGCCG TTATTTTCAC TACCTGTTTC 1440 

TTTAGTAGTA CTCATTGGTT TAACAGGTGT 1500 

GTCTGAATCA CTGTCTGAGT CTGAGTCGCT 1560 

GTCGCTATCT GAGTCTGAGT CGCTGTCTGA 1620 

ATCTGAGTCT GAATCGCTGT CTGAATCTGA 1680 

ATCTGAGTCG CTATCTGAGT CCGAATCGCT 1740 

GTCGCTATCT GAGTCTGAAT CGCTGTCTGA 1800 

GTCTGAGTCT GAATCGCTAT CTGAATCTGA 1860 

ATCTGAGTCG CTATCTGAAT CTGAGTCGCT 1920 

GTCGCTGTCT GAGTCTGAGT CGCTGTCTGA 1980 

TGTATCTTCT TCGAAGTATC CGTTATCAAG 204 0 

GTCAACTTCG CCACCATCTG CATCTTTATC 2100 

TAAGCCAGCA GGCTTTTCAA AAATAACTTT 2160 

GTATTTACCA TTTTCATCTG TTTTAGTTGT 2220 

AGTAACTTTA ACATCTTTGA . TACCTTTTTC 2280 

GTCGTACCAA ACATAATCAC CTAAACTATA 2340 

TGTCATGTTA TCTGCATCTT TAATGACACC 2400 

AGTATCATTT CCAGAAGTTA CTGAAGTTGG 2460 
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TTGATATTTA CCATTTTCAT CTGTTGTAAC TGTTTTTAAA ACTTTGTCGT TTTCATCTTT 2580 

TAACGTAACT GTTACACCTG AAATGCCCTT TTCATCTTTA TCTTGAACAC CGTTTTTATT 2640 

TGTATCTTCC CATACATAGT CACCTAAGTT GTAAGTCGGT TTGTAGAAAC CAGAGTCAAT 2700 

AGTATCGTTA TCTTTATCTT TAATGACACC TGTTGTTGAT GTACCATTTG AATCTATACC 2760 

TTCATCAGTT CCTGAACCTA CTTGTGTTGG TGTGTAACCT GATGGTGTTT CGAATTCAAC 2820 

TTTATAAGTT CCATTTTCTA ATCCAGTAAA TTGATATTTA CCATCTTTAT CTGTTTTAGT 2880 

TGTTTGTAAA ACTTCACCGT TTTCATTTTT CAATGTAACT GTTACGCCTG AAATACCTTT 2940 

TTCAGTTGAA TCCTGCTTAC CATCTTTATT TGTATCTTCC CATACATAAT TACCTAAATT 3000 

ATATTTTGGT GTTTTGTAGA ATCCACTATC TAATGTCATG TTATCAGCAC CATTAATAAC 3060 

ACCTGTTGTT GTTAAACCAT TAGAGTCTTT TTCAATGTCG CTACCAGATG TTACTGTAGT 3120 

20 CGGTGTATAG CCTTCTGGTG TAGTAAATTC AACTTTATAA TTACCATTAT CTAAATCAGT 3180 

AAATTTATAT TTGCCATCAG CGTCTGTTGT AACTGTTTTT AaCAgTTACC GTTTTCATCT 3240 

TTTAATGTTA CCGTTACGCC AGATATACCT TTTTCATCTT GGTCTTGGAT ACCATTTTTA 33 00 

TTTGTATCTT CCCAGACATA GTCACCTAAG TTGTATTTAG GTTTGTAAAT ACCTAAGTCT 3360 

GCAGATAAGT TATCTTTGCC ATTAACTGTA ATAACTGAAG ATAAGCCGTT TGAATCTAAT 3420 

TCTTCGTTAT TACCTTGTTT TGAAGGGGTT ACTTCATAAC CTTTTGGTAA GTTTGAAAAT 3480 

TCTACACGGT AATCTCCATT AGGTAAGTTT GGAATCAAGT ATGACCCATC TTCTTTAGTA 3540 

ACTGCTTCTC CTACTTTTGT ATTTGTATTA TTATCAAATA CAGTTACAGT TACATTGCCA 3600 

ACGCCTTTTT CTCCTAATTC TTGAACACCG TTTTTATTAG TATCTTCCCA TACGTAGTTA 3660 

CCAATTTTAT ATACTTCTTG ACCAGctCCG CCACTTTGGT TATTAGTAAA TCCTAAAGCA 3720 

TTGCCAGTAG AAACGGATTT ATTACCTGTT GAAGATAAAG TAGCCATTTG AACAAGTGTT 3780 

40 GGGCTTTCGC TATTTGTATA TTGGAATTTT GTATTAACCA TTACAACATA AGCAGAATCT 3840 

GCATTTCCAA AATCAATAAC AGCGCTATTG TtGTCGCCAT ATGTAATTTT CTGCAAGTAT 3900 

TGATTTGTTA CATCTGTAAG CTCTTTAGTA TTCACATCGT ATCCTTTATT TAATGTATAA 3960 

CCTTTAGGAA CTTGATATAT TTTTATATCT GTTACATCTT TATTT 4005 
(2) INFORMATION FOR SEQ ID NO: 632: 
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(i) SEQUENCE CHARACTERISTICS: 

(A} LENGTH: 1440 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY; linear 
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10 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 632: 

TATTAGGTTA CTCTAGTTTC CAAAGCGGGA ATTTTAATGT TATTAACAGC AAGGACAGCA 60 

AAAGCAATAT CGGCGCATTG ATTGAAAATC CAGGAATATA TCCTTTTATG TCTGGATATG 120 

AAAACTTGAA GTTATTGAAT GAATCAAAAA ACACTCAAGA TATCGATAAA ATTGTCTCAC 180 

AACTTCATAT GGATGAATAC ATTCATAAAA AAGCTAAAAC GTATTCTCTT GGTATGAAAC 240 

AAAAATTAGG AATTGCTATA GCATTTTTAA ATAAACCTCA ATTCATTATC TTAGATGAAC 300 

CAATGAATGG CTTAGATCCA AAAGCTGTGC GAGATGTACG TGAAT7GATT GTCCAAAAAG 360 

75 CGCAAGAAGG TGTrACTTTC TTAATTTCGA GTCATATTTT AAGTGAATTA GTTAAAATCA 420 

CAAACTCTAT CCTTATTATT AACAAAGGTA AAATTGTTAC AGAAACATCG GAAGAAGAAC 480 

TTAAACAATT TAAAGATAAT GATTTAGAAA ATGTATTACT AGAAATCATA GAAAGGGAGG 540 

ACCAAGCATA AAATGGGAAC TTTAATTAAA CAAGAATGTT TCAAATTATT TAAAAAGAAA 600 

TCAACTTTTA TCGCACCTAT TGTCTTTATT CTACTAATGG TTGCTCAAGG TTATATTGCT 660 

ACAAAATACA ATGAAATTTT TACGCCACAG GAATCTTTCA CATCTGCTTA TAATGGTTTT 720 

TCATGGTTTG CATTTTTATT AATTATTCAA GCAAGTACAA TCATTTCAAT GGAATTTCAT 780 

TACGGTACGA TTAAAAATTT ACTCTATCGT GAATATTCAA GAACAACTAT GATTGTTAGC S40 

AAAATCATCA CATTATTTAT TATTTCTTTA ATTTATTTTG TTATTACAAT TATTGCTTCA 900 

ATTGTTATTG GGTCTTTATT CTTTAATGAT TTAAATATAT TTGAAAGTAG CGGTAATCAA 960 

TTATCTTTAT TGAATCAATT ATTATTAGTT AGTTTAGGCA CATTTGTTGG CGTTTGGTTA X020 

35 GTTTTAAGCT TAACGTTGCT ATTATCATCT GCAACAAATT CAACGGGAGT AGCCATTGCT 1080 

GTAGGTATTG TTTTTTATTT TGCAAGTTCT ATTTTAGCAG TTATTCAAAC GGCACTTTTA 1140 

GAAAAAATAG ACTGGCTAAA GTGGAATCCT ATTAATATGA TGAATATTAT GCTTCAAACA X200 

40 GTTGAAAJVAG GCTTTAGTAA GTCGACAAAA TTAGAACTTC ATGAATTGTT TATTGGTAAT 1260 

ATTGCTTATA TTTCTATTTT CTTAATACTT GTAGTATTTA TTTTCAAGAA GAAAAATATT 1320 

TAGTAACTTA AAGTATTAAA TGTCTAAATA CACACATATT CCATCGTAAT TCAAAATCAT 1380 

TTTCAAATCC CTTCACCCAA ATAATGGTGC GGGGATTTTT TCATCCAAAT TTTGGAAATT 1440 
(2) INFORMATION FOR SEQ ID NO: 633: 
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(i) SEQUENCE CKAIU^CTERISTICS : 

(A) LENGTH: 1323 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 633: 

GCTGACATAA TTGCATCAAA TTTCACATCC CCATAAAAAT CGCTACCACA TAACCTACGA 60 

TAATACCTAC AAGAACTGGA ATTAAAGATA GGAATCCTTT AAAAAATCCT TGAACGACTA 120 

XTGTTACAAG CAAGGTTATC ATTGCAACAA TTAAGAAACT GATATTGTAA CCTTTCATAT ISO 

CTCCAGGATT TTCATACATT GCCATATTGA CTGCAGTAGG CGCTAAGCTT AAACCAATTA 240 

CCATGATGAC TGGTCCAACA ACAACTGGTG GTAATAATTT CATTAACCAT GCTGTCCCAC 300 

TTAATTTGAT TAGAATCCCG ATGATGACGT ACATAACACC ACTCATGaAT AATGCTACAA 360 

GCATGTCTCC TAAGCTATGC GTACTTAATC CCGTGATAAT TGGCGTGATA AATGCAAAGC 420 

TAGATCCCAA GTATGCTGGT ATTTGCGCCT TCGTTATTAA GATATAAAGT AATGTACCGA 4 80 

TTCCCGAAGC TAGTAACGCT GCTGATATTG GTAGTCCTGT TAAGAATGGT ACTAGTACTG 540 

20 TTGCGCCAAA CATCGCAAAT AAATGTTGTA AGCTTAAAAA TGCCCATTGC GCTGGTTGTG 600 

GTTTTTCATT TACATCTAGT ACGGGTTTTA CTGTTCGTTC AAACATTTCA TCATTTTGCA 660 

TAATATTCAT TTCCTCCGAT AATAAAAAAA TCTCTTTACA TCAGTATATG TAAAGAGACA 720 

AAAAGTGTGA CAAGTTGCTA CAAGTCATTT TCGTCCATAG AAATTGACTT ATAGTTGTCG 780 

AACATGAGGG TATTATTAGA TAAACAAGCA TATGAAAACT TATTTATCAT TCAACTCCCC 840 

CACCTTTTTC AGTCTCTCGT ACTGAATTAA AAGGGGtATT ATTTAATTAT AACTGCATTT 900 

CTTTGATCcA TTtCTTCyAA ATAGACACTT ACCGTTTCCT CTTTAGAAGT AGGTAwATTT 960 

TTACCAACAA AATCTGCTCG AATTGGTAAC TCACGATGTC CTCGATCAAC CAAAGCAGCT 1020 

AAACCAATTT TAATAGGTCT AGCATTTAGC AAAATAGCAT CAAGTGAAGC ACGAACCGTT 1080 

CGACCAGTAT ACAGCACATC GTCAATAATG ATGACTACTT TATCTGTAAT ATCTGTGTCG 1140 

ATGTCTATTG CGTCTTTTGT CGTAAGTGAT GACATGTGcT CTATATCATC TCTAAAGTAT 1200 

40 GTAATATCAA TTGTTCCAGT AGGTATACGT TGTTGCTCAA TTTGATGAAT TTtATCTTGT 1260 

ATACGATTCG CTAAATATTC ACCTCTTGTn TTGATACCTA AAAGATTAAA TTATCAGTAC 1320 

CTT 1323 
(2) INFORMATION FOR SEQ ID NO: 634: 



25 



30 



"35 



45 



(i) SEQUENCE CHARACTERISTICS; 

(A) LENGTH: 761 base pairs 

(B) TYPE: nucleic acid 
so (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 
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ACCCATCTCA TCGTATTTTG AATTTAATAG ACGAGATCGA TGTATATCTG AATTCATCCC $0 

AACTATGGAT TAATGTTGGT ACATCATtAA cGCATAACCA ACATTTTGAG CAGTTGTTTT 120 

ATAAGTAACG TGATTTTTAT CTAATTGCCC TCTTAATGCG TCCTCTGTAA ATTCAACACT 180 

ATCAGAACCA TTAGAGGTCG CTTCATATAA GTTATTAGAT GCAATATGTG CTAAATCGCT 240 

ATTGATTTTC AATGGTTTTA ATCCTTTTAA TTTTCTCATT TCATTCGTTA CTTCATAAAG 300 

AGAAATTAAT TGATTTGGAT TTTGCTCAAC TGGACGCTTA TTATGCTCTT CTGACGTAGA 360 

ATTAGAATTT AATTGATAAG GTTCAATATC TGCTAACATT TCTTTTGTTA AAAATCGTAC 420 

ACTTAGCACC TTTTTCGATT GTTGATCAGA ATACACTTGT GCATATATGT CGCCATATTT 480 

AATCaGTGTT TGTGTTTTTA AATCTTCATC TGAAAGTTCA AATTCATATT TTTTACCATC 540 

AACTTTAAAG GACGGTTCTG GATTAATACT TGTATGATTA AAAATTTCTG CAGAATGTTG 600 

TCCTATTTTT AACGGACTAA CAITGACTTT CTCACCTGTA GCATAGACTG AAACX5ATTTC 660 

TTCACGTTTA GTTGAAACAA TGTAATAACT GTTTTTGTCT TTAAACACAT AATTTTTGTA 720 

rCCATCTCTA AAAGGGTAGA CrCGATCTGC TTGTCCAAAT T 761 
(2) INFORMATION FOR SEQ ID NO: 635: 

{i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 827 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



35 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 635: 

nTAAATATAT TTATATATTA TAGAATAGAA AGACCTGAAG ATTGAATATC TTTCGCAAAG 60 

CCTTTAACTG TATCTACTGA TAATTCGTTA ATATCGCGAC CTAAGTTTGT ATTCACTTTT 120 

TTCACAACAT CTGCTGGGCA TGTAATAATA TCTGCACCAA TTTCATCAGC TTGAATCACA 180 

TTGAATAATT CGCGGCAACT TGCCCATAAT AATTTAACGC CGTCTTTACT ATGCGTAACT 240 

TTnACAGCCT CTkTCATTAA TGGTaATGGA TCTACGCCTG TAtCTGCAAT ACGTCCTGCA 300 

AATACTGAAA CATATGTTGG CACACCTTCA GTTACTGCTT CAGTTATTTC TTTAACTTGT 360 

TCAATTGTGT AAACAGCCGT AACGTTTAAT CTCACATTGT CAGCTGAAAG TTTTTTAATT 420 

AAAGGAATCG TTGATTCACC TTTTGTATTT ACAATAGGAA TTTTAACAAA TACATTTTCG 480 

CCATATTGTT TTAAAATTGC TGCTTCTTTk TCCATAGTTT CTAAATCGTC TGCAAATACT 540 

TCAAATGArA TTGAAGCATC TGGAATTTCT TTCACAGCTT CTTCAGCAAA AGCTTTGTAA 600 
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TTTTTATAAG CTGCTTTCAT TnCTTCAATA TCTGCACCGk CCGCAAATAC TTCTACATTT 720 
AGTTTAGCCA TATAAyATAG CCTCCTTGAT TCTTATTAAA ATTTTAACAA CATCTGCATG 780 

5 

kCTTTTTCTT ACAACCATTT GTAAAAAATG ATTTTTATTT CITtGTT 827 
(2} INFORMATION FOR SEQ ID NO: 636: 
(i) SEQUENCE CHARACTERISTICS: 

7^ (A) LENGTH: 1478 base pairs 

CB) TYPE: nucleic acid 

(C) STRANDEDN2SS: double 

(D) TOPOLOGY: linear 

75 

{xi) SEQUENCE DESCRIPTION: SEQ ID NO: 636: 

TTAGTCGGTA TAACCATCGG CTAGGTGGTT TTTGTATTAA AAAAGTGGAT aCCAAAATTT 60 

20 ATTAATAATT ATTTTAATGT TAGAAAAAAA CTAAATAAAA ACTCGCTAAT GATATCCAAT 120 

AATATGTATA CAAAACGAGA CATATATTGC ATATGATTAA CGAGATACTG AAAATATTTT 180 

ATCACCCCTA AAATGATTAT TCATTTTCAG CGGTAATTCG ACCTAAAGTC AAACTTACAA 240 

TAAAACCGAT GATAAATACT ACTAATGAAA CGAACCACAT CACGATATTA GTTGGTAAAC 3 00 

CTGGAAATAC TGCAAAGAGG GAGCCAACAA CAAAACCAAT GATTAATGCA AAAGTCATTA 360 

GTTTATGATG TGTTAGGAAA TACTGGATAA TTTTGCTTGA AATAATGAAT CCAGCAAGCA 420 

30 

CGCCAAATCC GACTGCAAGT AATATAGGAA GACCTGCAAA GTTAAGTTTA ACAACTTCAG 4 80 

ATATTGCTAG CATGACCGTA CCATAGACGC CAAATACTAA TAACATAAAT GACCCTGAAA 540 

TACCTGGGAG TAACATAGCA CTAGATGCAC ACATACCTGC AATAAAATAT TTAATAATAA 600 

35 

GACTAGTTGA TAGAGTAAGT GTTTCTCCAG CATGTTTATC ACCATTATTC ATTAATGTAA 660 

TAACAATTAA GATAGCGATA CCAGCTATAA CCATCATGTA ATGTyTAGTT GTAAATGACG 720 

40 TTTTATAGTT AGAAATTTTC AATAAATATG GAACGATACC AATGATTAAT CCACCAAAGA 780 

AAAACATAGT TGGAATATGG TGTTGGCTTA ATAAATAATT AAAAAGATTA CTTAGTGATC 840 

CCATTGCCAG TAACATTCCA ATTATAATGG GGATTAAAAA TGTAAAACTT GGCCAAAAAC 900 

GTCGTGAGAA TATGCCGCTA ATTGAAGCGA TAAATTGATT GTAAATACCT AACAATAATG 960 

CGATAGTCCC ACCGCTAACA CCAGGTACCA AGTCACTCGT TCCCATAGCA AAACCTTTTA 1020 

GAATATTAAT CCATTTAAAT TGTTGCATGA ATAACTCCTT TCAAACGATT GGAATAAAAT 1080 

SO 

CATAAATAGC ATCATACCAT ATTACAAATG TCCTAGTGAA ATGATAACAT ATTTTAAATT 1140 

CATAAAATCC ATTGAGAAAT TATGTGCACT TATTATCATT TATATTTTTA AAGAGAGCGG 1200 
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AGGTATAAGT AAGTTATAAT TAACTGAACG CATTATTACA AAGTCTTTTT GACTACAAAT 1320 

TAAAATTATT ATAAACTAGT TAAGAAAACT TTATATTTTA CGGAGGGAAT ATAAAATGGC 1380 

ATCAACATTA GAAATyAAAG ACCTACATGT GTCTATTGAG GATAAAGAAA TCTTAAAAGG 1440 

TGTTAACTTG ACAATTAACA CTGATGAAAT ACATGCGA 1478 



(2) INFORMATION FOR SEQ ID NO: 637: 

10 

ii) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1995 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

{D) TOPOLOGY: linear 

75 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 637: 

20 ATTACAGCAT CTTCTCTAGG TAGATTATTA AAAGATAGAG GTCTAAATGT AACAATTCAA 60 

AAATTCGATC CATACTTAAA TGTTGACCCA GGTACAATGA GTCCTTATCA ACATGGTGAA 120 

GTATTCGTAA nGGATGATGG TGCAGAAACT GACCTAGACT TAGGACATTA CGAAAGATTT IBO 

ATTGATATTA ATTTAAACAA GTTTTCAAAT GTGACAGCCG GTAAAGTGTA TTCACACGTA 240 

TTGAAAAAAG AACGTCGTGG TGATTACTTA GGCGGAACAG TTCAAGTTAT TCCGCATATT 300 

ACAAATGAAA TTAAAGAACG TTTATTACTT GCAGGGGAAA GTACGAATGC AGACGTTGTT 36 0 

30 

ATCACTGAAA TTGGCGGTAC AACAGGTGAT ATTGAGTCAT TACCGTTTAT TGAAGCGATT 420 

CGTCAAATTC GTAGCGATTT AGGTAGAGAA AATGTTATGT ATGTTCACTG TACATTACTG 480 

CCTTATATTA AAGCTGCTGG AGAAATGAAA ACGAAGCCAA CACAACATAG TGTTAAAGAA 54 0 

35 

TTACGAGGCT TAGGTATTCA ACCAGACTTA ATCGTTGTAA GAACTGAATA TGAAATGACA 600 

CAAGATTTAA AAGATAAAAT TGCATTATTC TGTGACATTA ATAAAGAAAG TGTTATTGAA 660 

40 TGTCGTGATG CAGACTCTTT ATACGAAATT CCATTACAAT TAAGCCAACA AAATATGGAT 720 

GATATCGTTA TTAAACGTTT ACAATTAAAC GCGAAATATG AAACACAGCT TGATGAATGG 780 

AAACAGTTGT TAGATATCGT TAATAATTTA GATGGTAAAA TTACAATTGG TTTAGTAGGT 840 

AAATATGTTA GCTTACAAGA TGCATATTTA TCAGTTGTTG AATCATTGAA ACATGCTGGA 900 

TATCCTTTTG CCAAAGATAT TGACATTAGA TGGATTGATT CAAGTGAAGT AACAGATGAA 960 

AATGCAGCCG AATACCTTGC AGATGTCGAC GGTATTTTAG TACCAGGTGG ATTTGGTTTC 1020 

SO 

CGTGCAAGTG AAGGTAAAAT TAGTGCAATT AAGTATGCTA GAGAAAACAA TGTACCATTC 1080 

TTTGGTATTT GTTTAGGAAT GCAACTTGCA ACAGTTGAAT TTTCAAGAAA CGTATTAGGC 1140 
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TTACCAGAAC AAAAAGATAT 
TGTTCAATTA AAGAAGGCAC 
^ AGACATCGIC ATCGTTATGA 
ATGGTGATTT CTGGTACAAG 
AATGtTTCTT TATTGCTTGT 

10 

ACCCGATTTT TAAATCATTT 
GCTAATAAAA CCGGTACTTT 
j5 TAATATTATG TTAGTGACAA 
CTTGTCATTT CAATCATTTG 
TGTGGTyGGA CAATCTTATC 
TCGATAAAAT GTACGAGATG 
ACCACATCGA TATCTAAGTC 
AATGGTGCGA ATAATAATAC 

25 

TaAGTTTnCG GCTAG 1995 
(2) INFORMATION FOR SEQ ID NO: 638: 

(i> SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1107 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

35 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 638: 
ATTAGTGATG AAAGTCAGAT TGAAGCTTTA TTAACAGCTG AAAAATATTC AGAAATGATT 60 

40 

GGTGAATAAT CACCGTGTAA CTCCTTAATC TAAGATTGAG GAGTTTATTT TTAGTCTGAG 120 
AAAATAAATG ATATGAAAGA AAAATTATTA GGTACTATTA TTTGGAGTAT TGCTACATTT 180 
TATTATTCAA GAATGATGGA AATAATGAAT TTAGCTATTT TAAAAATAAA AATTGGGGGA 240 

45 

AGTTAATATG CTAAACATTC AAGACGTTAa CATnCTTTCT AAAAAGGAGC AAAAAGCATA 300 
TAACCGTTTC GTAGAATCTG TAGAAAACGG TAATTTACCA GTACTACCAT GTATTGAAAT 360 
SO GGATCTAAAA GAGATGCAAG AAGAAACATT AAACCAGAGT AAGATTGGTG GAATGCCATT 420 
TTTAAAATCT TTTAAAGATA TACCATTAGA TGAAAATAAT GTACCAATGG TATTGCTAGC 480 
ACAGATTAAT TTGGATGATC TTCCAGAACA ACAAGAATTA TTTCCTGTAA AAGAAGGGAT 540 

55 



CGAAGATTTA GGTGGTACAT TACGCTTAGG CTTATATTCA 1260 

ATTGGCACAA GATGTTTATG GTAAAGCGGA AATTGAAGAA 1320 

ATTTAATAAT GACTATAGAG AACAATTAGA AGCAAATGGT 1380 
tCCAGATGGA CGTTTAGTAG AAATGGTAGA GATTCCGACA . 1440 

CAATTCCACC CAGAATTCTT ATCTAGACCA AATCGTCCGC 1500 

ATTGAAGCTT CATTAAAATA TCAACAAAAT AAATAAATTT 1560 

CATTGTTAAA CATTGAAAGT ACCGGTTTnT CGTATAATTT 1620 

GGTATGAAAT AACAATAGTG ACTTTTATAA TTCTAAGTCT 1680 

TGTATAAATG TCATAGTATA CATAATTCAA TGCCATCGCA 1740 

GTAATCTTCA GTGTAGACTA TAGGTcTTGG TGTAGATAAA 1800 

ATCAGGGAAA TCATCTGTTT TAGGTTTGTT GCITATTAAG 1860 

GATAAGTTTT TGAATATCTA ATGCAACTTG ATyATTATAA 1920 

ACGATCAGTT GAGTCAATTT CTTTAAwkTC TTTAATAGCG 1980 
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5 



10 



15 



AAACAATATA AACTCAAGGC TTGTTTATAT AAAAGAGCCA ATTACAGATT TATCACTCGA 660 

AAATATTCAA GCGCATTTGA AGTCATTAGA TGCTGATAAT GAGGATATCC CGTTCAGTGG 720 

AGCATTTTCT ATAGAATTTA GATTGTCGAA ACAAACTATT ACATGTACTG ATTATAAGTA 780 

CGATGAGGAC GTGCTTGCAT TGTGGAATAA AGTCAATCCA TCCTTCGCGC TAAAATCAAT 840 

GTTTGGTGGT TATGATGAAT TGATGGAACC TGTGTGTAmC AywTTTACTG CTAAGgAACC 900 

ATTTAATCAA CTTGGTGGTT ATCCATATTT TGACCAAATA GATCCAAGAA CGAACGATcA 960 

AGAACTGAAA ATGTATGATA GAGTCTTACT GCAAATTGaT TCTACAAGAG ATGGTAATTC 1020 

TTCGATTATa TGGGGTGaTT TAGGTATTGc CAATATCtTA GTGaAATCTA CTGrACCTTG 1080 

aGGcTAtGaa GTTTTGAATG ATTACCT 1107 
(2) INFORMATION FOR SBQ ID NO; 639: 

20 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 904 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

25 

ixi) SEQUENCE DESCRIPTION: SEQ ID NO: 639: 

ATTCA' 

30 



35 



40 



45 



SO 



ATTCATATTA 


TTATAAATTA 


TTTCTACACC 


ATCCCAATTG 


AGTTGTTTTT 


CATAATTTAA 


60 


ATGTAATTCC 


ACTAACTCCC 


TACCAATTTC 


AACAAATCCA 


TATACATCCT 


TTAATATCGG 


120 


TATTCGCGGA 


AAACCTTTAC 


TCAAATCACT 


TGAATATTTG 


TTCACATAAT 


ATTTATGATG 


130 


CAAAATTGCA 


TATATATAAT 


ATACTATCTC 


TTCTGAATTA 


AGATTTATTT 


TCTTTTTAAA 


24 0 


AGAATTAGgA 


AATATTATCT 


ACArGCCTCA 


AACTATCTTT 


ACCTTTGtAT 


GTAGCAAAGC 


300 


CTTkGCCATT 


ACCAATAAAC 


TGGAAATTAG 


GTAATATGTC 


CGTGATCATA 


GCCGAGAATT 


360 


CTTTATTCAT 


TCCCTGTCCT 


TGTATATAAA 


TCACCTGTCC 


AGTATTCTCC 


ATTATATTAT 


420 


AATATCTACT 


TGGCATTTCC 


ATAATATTTT 


TGTCGTACAC 


TATCCATTTT 


TTTGTAAATG 


480 


GTCTATGCAT 


AAATTTAACA 


ATTCTCTCTG 


GATTAATTGA AATATTTTTT 


CCTTTAGAAA 


540 


ATTTTTGGGT 


AAGTCCTCGT 


GTCCAACTaA 


TaAATGTTTC 


ATCTTTGTTC 


ACTAAATTTA 


600 


TACGTTCTCT 


TGAATCTAAG 


ATATCAATTA 


ATCTATCTAT 


TTCAGAATTA 


TAGTTATCTA 


660 


CAAGTAATTT 


TGcA'ITrACT 


AATGCTTTTT 


CATTCGAAAA 


ATTTGTTACC 


CAATTATCTC 


720 


TTGCTGaATT 


TACTCCATTA 


AATkGAkCTA AATATATAGA ATTTTCAATA 


TCCTTGGAAT 


780 


CATACATTGG 


TAAATAATTC 


CCCATAGTTT 


ATGTCTCGGT 


GATTAATCCA 


ATCATTGGGG 


840 
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10 



20 



25 



AAAG 

(2) INFORMATION FOR SEQ ID NO: 640: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 436 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



904 



{xi) SEQUENCE DESCRIPTION: SEQ ID NO: 640: 

75 CGATGTCTTT ACTATTAGAC TTAGCCATTG GTTTCACCTC TCCAAAAATT GTAAATGTGT 60 

ATCATCAATA TGAAAGTTAC ATAAAACTGA CATATTTCTT TAAAATATCA ACGCCATTGA 120 

TAACTTCCTG TTTTAATTGA TACGCTGTAA CAAAATACTA TAGTTAGTGC TTACATGTAT 180 

ATGTTAAAGC AAGCAGTGGT AAATGTAAAT TATAATTATT CATTAACTTT GCAATATATT 240 

AAATCTTTTA TTCATAGAAG ATAAATATCA AATCAATCAT AATTATTTGA CAACAAATAG 300 

CTAACGATTG TTTTAATCTA CATTTGGCTT ATAGCATTTT AAACCTATAC TCTATTTTGA 360 

TACAATATAA GTGTAAAATC AATCATAAAA AGGATATTCA ATATCTGCAT CCAAGAAAAA 420 

CATTACAATT ACCTTT 436 
(2) INFORMATION FOR SEQ ID NO: 641: 

30 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 442 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 
35 (D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 641; 

GTTAnAAAT TCAGAGTGGT AGCAAATTAA AGTTAnTCAA GAGTTAAGAT GAATTTAATT 60 

CATGAACACG TCTATTATTT TTATAATTGT AGCAAATAAA GCTTTACATC AAGGAGGTAA 120 

TTAAATATGT TCAAAAAATA TGACTCAAAA AATTCAATCG TATTAAAATC TATTCTATCG 180 

CTAGGTATCA TCTATGGGGG AACATTTGGA ATATATCCAA AAGCAGACGC GTCAACACAA 240 

AATTCCTCAA GTGTACAAGA TAAACAATTA CAAAAAGTTG AAGAAGTACC AAATAATTCA 300 

GAAAAAGCTT TGGTTAAAAA ACTTTACGAT AGATACAGCA AGGATACAAT AAATGGAAAA 360 

TCTAATAAAT CTAGGAATTG GGTTTATTCA GAGAGACCTT TAAATGAAAA CCAAGTTCGT 420 

ATACATTTAG AAGGAACATA CA 442 
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(i) SEQUENCE CHA3?ACTERISTICS : 

(A) LENGTH: 24 72 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
(0) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: 

10 

CCAATTTTGG TATGAATTAT ACAGATAATT 
ATCAATTCGG TGTGGATAAA TGGATGAATG 
ACTACTGCCA ATAACGGAAG ATATATTTAT 
GTTTCGGGAG CACTAGCTTT AATCATTGAT 
GCGATTGAAT TGTTATATCA GCATGGGACA 
20 GQGCATGGTG AGCTTGATGT GTATAAAGCA 
TAAATCAAAG GAGTTTTTGA TTATGGCAAA 
TAAAAATCAA GATGTATTAA AGCATATTAA 

25 

ATTACTTGGT ATTAATGGAG CCGGTAAAAC 
TCAACAAGAT TCAGGGGAAA TTAAATTAGA 
CAAAGTTGGT TCGCTTATTG AAACACCTGC 

30 

TTTGAAAATT GTGTGTTTAA ATGAAAGCGT 
CTTAGTCAAT TTAAATGTCG ATAAAAAGAA 

3^ ACAAAGACTT GGAATTGCAA TGGCaTTAAT 
ACCATCTAAT GGTTTAGACC CATATGGAAT 
AACAGAACAA GGTACTAGTA TTATTATTTC 

40 AGCAGATCAT ATCGGTATTA TTCATGAGGG 
AGATGAAAAC TTAGAAGAGA TATTCTTCAA 
TTAAAGATaG AAGGTATCAA ATTTAAAAAt 

4S 

CcGcTGGTAT TTCTTTGTTT TGCTATTTTC 
ACAGCGAATA GTGTGTCACC ATATATAACT 
ATCCCQAITG TATTATGTAT GGCTTGTAAT 

SO 

TCATTTAATT ATTACTTAAG TAATAATTGG 
TTCATTTTAT CAATAGCATT TTTGGTACAT 

55 



\EQ ID NO: 642: 

CnGCGCCCGG AGGATCATTT GCTTATTTAA 60 

AAGGGTATAT GGCATAAGGA GAACATTTTA 120 

CAAGCTGGAA CTTCATTAGC CACACCTAAA 180 

AAATATCATC TTGAAAAACA TCCAGATAAA 240 

TCTAAGAATA ATAAACCATT TAGTAGATAT 300 

TTAAATGTAG CAAATCAAAA AGCAAGTTAA 360 

ATTAGTTACT GAAAACATTT CGAAGCGGTT 420 

TATCACTTTA GAAAATAACG AAGTTTATGG 480 

GACACTTATG AAAATTATAT GTGGCATACT 540 

TAATAGACCA ATGACACGAA ATGATTTGCA 600 

GACATATAAT CATTTAAGTG CACAAGATAA 660 

TGATTTCaGC GAAATTAATA GTGTTTTAAG 720 

AAAGGTTAAG GACTTTTCTT TAGGTATGAA 7 SO 

TAAAAaGCCA GAAATTTTAG TATTAGACGA 840 

CCAAGAACTT AGAGAACTTC TAAAATTATT 900 

AAGTCACATT TTATCTGAAA TCCAAGTTTT 960 

TGAGCTAAAA TATCAGCAAA GAAATAACAA 1020 

AATAACGAAA GGTGATTACA AATGATACAT 1080 

TCTTTCAGTA TGTATGTTTT ATTAATAAGT 1140 

ACAGTCTTAT TCGCCAAAAG TAATACGGGA 1200 

TTACTATTTA ATATTTGGCC AATTGCTTTC 1260 

TCGTTATTTA AAATTGAAAT GAGAAATAAA 1320 

TCGATTACAA AAGAAATAAG AGCAAAGATT 13 80 

TGCTTTTTAG TATTTATTAT TGCTTATATA 1440 
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TTGATGTATG TAGTATCTCT ACCATTGATA CCGCTCAACT TTTTATTAAC TCGATACTTT 1560 

GGTGTGTTCG TATCAATATT AATAAACTTA GTATTATCAG TCATTTGTGT CTTGTTTTTA 1620 

5 

ACATTGAAGA GTTTATTrTG GGTGTTGCCG TGGGGGATAA TGCAGAGAAT CCCGCTTATT 1680 

ACGCTTGGTA TACTACCTAA TGGtTTAGTT GTAAACCATA ATTCAAAATA CTTTAATGAT 1740 

CTCAATGCCT TATATATTTC GATTATTGTT AGCATCATTA TTTTCGCGAT AGTAACATTT 1800 

10 

TTAAATAATA AGAAAAGTTG GCGATTAAAA TGATAATTAA CGAATTAAAG TCATGTAAGT 1860 

TGAAATTTTC TAAGCAAGCG CTCACATTTG TACCCATTAT TGTAACCATA TTGTTTATAT 1920 

75 TATTTATAAA TTGGTATTTA AACGTAAATT TATGGAATGG TCGACAAATm AGTTTGTTTA 1980 

CAGCGAGTTT TAATGCAATT ACATCGCTAT TAATTTCTAT AAACGTCTAT CAAGTTATCA 2040 

ATTTTGAAGA AAATATTGGT CACTTTAATC ATATTTTAGG AAAAGCTAAT AGGCTAAATT 2100 

GGTTAAATGC ATCAATGATT TTTACTTATA CTATTACAGC CATATGTATT CTATTAGCAT 2160 

CAATTAATTT ATTGTGGCAT TCACATGATA TGAAAATAAC ACTTATGTTT ATAGGcGTaT 2220 

CATTGTTrTT CAATGTaATT ATATTACTGC TACTTTTTAT TTTTAGTATT TTCATTAAAG 2280 

25 

ATGTAATGGC TATTGTTGTC GGAGTTTTAA TGTTTATTTT TAACGTTTAT TTTGGATTAG 2340 

AAGTGCTTGG AGATCATTCG TGGTTCTATT TACCAATCAC ATATGCTACA CGTTACGTTT 2400 

ATATGTTTAn CGAAGGGGAG TATACCAGTT ACATTAACAT TGGGCAATCT ATATnATTAT 2460 

30 

CACGnTGCCG AT 2472 
(2) INFORMATION FOR SEQ ID NO: 643: 

35 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 646 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : dotible 

(D) TOPOLOGY: linear 

40 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 643: 
ATAATATAGG AATTATTTCG ATnACAGATT TTACGAATCG TGCTACGATG CAAAATGAAn 60 

45 

ATAAAGATCC ATATGGCGAA AAGTTAGCTT ATGGAATTGC TTtTAATGGC AGTGTGGATA 120 
TGCAAGGGGA TAAACAAGTC ACAATTCCAA AATATAGTGT AGTTACAATT ACTGGCGAAA 180 
ATAGTAAAAA TTATCGTGTT ACCGCCGATA ATAAGACTTA CTATGTTAGT AAAGATAAAT 240 
TAGAATATTT TAACCCGGCA GGTTTATATC AAACGCATAG TTTTAAAAAA TTAGCACCAT 300 
ATATGAAATC AAATTATAGT AATTACTATG CATACTTTAA TAGTCAATTA CATAAAAAGC 360 
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CACAACAACC GATACAATTA CTTTTCAATG ATAATAATCA GTTATACGGT TTTGTTTATC 



480 



CAATTGTAGA TAAAAAAGAA TTAAAAGATA AGTTTAATAT TAACAATAAC ATTTGGATTA 



540 



CTAAAGTTGG GAATGGATAT TGTATTGCCA ATTTGAAAGA AGACAAATGG ATTTATATTG 



600 



AATTGTAGGT GTAAAGATGC TAGATAATAT TATTTTATAT TTTAAA 



645 



10 



IS 



20 



25 



30 



35 



40 



45 



SO 



(2) INFORMATION FOR SEQ ID NO: €44: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 426 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 644: 

TAATATCGGA ATTTGATAAT GAAGATATCT AATTTTTTAA TATTCGTAGC TTTTATTTTT 60 

CTACTTATTT TATGTTTATT TTTAATCTTA CAAATGACAA ACCATTAAAA GTAGCATCCC 120 

AACATCAAAC AAAAAAACAA TTCATCAAAT AAAAATCGCT ACAAAACCAA GTCATTAAAC 180 

ACGCAATAAT TAAAATTTTC CACTCATTAT AATTCTGAAT TCCAAATGTC GAATTCCGAA 240 

AACCAAACTC CAAATTCCAA AAACGCAACT CCAAAATTAA AAGCATTTCC CTACCATTCG 300 

GGAAATGCTT TTTACATACT GgATTACTCT GTCATTAATG ATTTTACAAC GGgAAACCAT 360 

GTCGtCATGT ATGACCaAAG TAGCGTCGCT AtCaTaAgGt GGTTCGGATC TTTATTGGAT 420 

AATnAT 426 
(2) INFORMATION FOR SEQ ID NO: 645: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3241 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 645: 

nTTATTTACC CACAACATGT TGCGACATTA GGTAAATGGG TACCTTATTT ACTTGGTATT 60 

GTTATGTTAG GTATGGGATT AACAATTACA CCTAATGATT TCAAAATGGT CTTTAAAGCA 120 

CCTAGAGCAG TAATTATTGG TGTCTGTCTA CAATTCAGTA TTATGCCCAC ATTAGCATTT 180 

ATAATTGCAA AGTCTTTTCA TTTACCACCT GATATTGCTG TTGGCGTAAT ATTAGTTGGA 240 

TGTTGTCCGG GTGGGACATC AAGTAATGTA ATGAGTTATT TAGCCAAAGC TAACGTAGCA 300 
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ATATATCTAT TTGCAAATGA ATGGTTGGAA GTATCTTTCG 


TGAGTATGTT 


GTGGTCAGTT 


420 




GTTCAAGTTG 


TATTAATTCC 


AATTGCTTTA 


GGTATTGTTT 


TGCAAATTAT 


TAATCGTAAA 


480 


5 


ATTGCTGAAA AAGCTTCTAC AGCTTTGCCA ATTATATCAG 


TTGTTGCTAT 


TTCATTAATT 


540 




TTAGCAATAG 


TTGTAGGTGG 


CAGTAAGCAC 


CAAATCTTAA 


CTACAGGATT 


ATTAATATTT 


600 


10 


TTAGTAGTTA 


TTTTACATAA 


CGTATTAGGG 


TATACGATTG 


GATATTGGTT 


AGCTCGTCTT 


660 


TTAAAATTAG 


ATCGACAAGA 


TCAAAAAGCA 


GTCAGTATTG 


AAGTTGGAAT 


GCAGAACTCT 


720 




GGTTTAGCTG 


TGTCATTAGC 


aGCATTGCAT 


TTTAATCCAA 


TTGCAGCAGT 


ACCAGGCGCA 


780 


15 


GTGTTTAGTT 


TCATTCATAA 


TATAACAGGG 


CCTATTTTAG 


CAAAGTATTG 


GTCAAAAAAG 


840 




TTATAATTGC 


ACTAATAGAA 


TGAAGTGGTC 


ATCGGACTAT 


GTTAAGCTTT 


GATAAAGAGA 


900 




AAAAATAGAG 


GAGTAAATAT 


ATGTATAGAG 


CAGTTATATT 


TGATTTCGAT 


GGAACAATAA 


960 


20 


TAGATACGGA 


ACAACATTTA 


TTTAATGTTA 


TTAATAAACA 


TTTAGAGATG 


CATAATGCCG 


1020 




ATCCTATAAG 


CATTGATTTT 


TATCGTTCTT 


CTATTGGAGG 


AGCAGCTACA 


GATTTGCATG 


1030 




ACCATTTAAT 


TAAAGCGATT 


GGTTCGGAAA 


ATAAAGATAA 


ACTTTATGAA 


GAACATCATC 


1140 


25 


TTACTAGTAC 


AACATTACCG 


ATGATTGATA 


CGATTAnATC 


ATTGATGGCA 


TTTTTAAAGC 


1200 




AACGTCACAT 


TCCTATGGCA 


ATTGCCACAA 


GTAGTGTGAA 


AGCGGAAATA 


ATGCCCACCT 


1260 


30 


TTAAAGCATT 


AGGTCTAGAC 


GATTATATAG 


AGGTAGTTGT 


TGGTAGAGAm 


GATGTTGAAC 


1320 


AAGTTAAACC 


TGACCCTGAA 


TTATATTTAT 


CTGCAGTACA 


ACAATTAAAT 


TATATGCCGA 


1380 




CACAATGTTT 


GGCTATTGAA 


GATTCTGTAA 


ATGGTGCAAC 


AGCCGCGATT 


GCAGCTGGAT 


1440 


35 


TAGATGTTAT 


TGTTAATACG 


AATAAAATGA 


CAAGCGCACA 


GGACTTTTCT 


AATGTAGATT 


1500 




ATGXAGCAAA 


AGATATTGAT 


TACGATCAAA 


TTGTAGCGCG 


TTTCTTTACG 


AAATAGGAGG 


1560 




CGTATCATGA 


TGGGTTACAT 


TATATTGTTT 


TTTCTAGCTG 


GTCCAGTAAT 


TTTAGGCGTT 


1620 


40 


GGAAAT7TGG 


TGATTGGTCC 


TATATTTAAC 


AAACAGACAC 


CATTTCGCGT 


GCAAGTAAGA 


1680 




TCTTTTGTTG 


kTGGkTCmAT GrTTTACTTA ATACTCGCAA 


CAATTGGCTA 


TTTTTTACTA 


1740 




TTACAAGGTA 


AACTTTAACG 


AGAAAACCAC 


CTTACCTCAT 


TAAATGGACG 


ACCATATGTA 


1800 


45 


TGTGAAATGG 


TAGAACGTTC 


ATGTTTATGT 


ATGAGATAGG 


GTGGTTTAAA 


TAGTTACATA 


1860 




TATTTTAATA 


ATAACGTCAC 


GATGATAAGT 


ACAATTAAGA 


TAATATCTAT 


GCCTACCATA 


1920 


SO 


ATTGXAGCTC 


TTGTTGCAIT 


ACTTCCTTGT 


TCTTTTGCTG 


ATTTCATAGC 


ACGGTAGTTT 


1980 


GGCACAAAGC 


TAATAATTAG 


TAAGATTAAT 


ACAATTACAC 


CAATTAATGC 


TGTTGTCATG 


2040 




ATGAACGACC 


TCCTTTATTT 


TTTTCAATCA 


ATTCCCAAAT 


AAACGTAGCA 


ATCACACCGA 


2100 
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CAATAATTAA TGCAATCGOT AAAGTCGTAC CGAGTTTAAT CTTGCGCTCT GGAGAATTAA 2220 

TAATAGTAAA TACTGTAAGA CAAATGAGTA TGAAAGCAAG TGTTGCAATA ATAGTTCTTC 2280 

CAACTAAATA TAGGATGTCA GGTTTTTCCA TACCGATATA ATTTATGATG AAAAATGCTA 234 0 

CAGCAAAGAG TACCGATATT TTTGTAGCAC GTAGCAGTAT TTGTTTTAAC ATTGATATAC 2400 

TCCTTTTTAA TATTATTAAA ATTATATCAT AATTACCAAG AATAGCTGAA GTTGTATGTG 246 0 

ACTCAACGGT ACTTGAGCAA CTTTTTTAAT TTTTTAGAAA AATCACAAAA TAATTGTTTG 2520 

CAAAGTTGCA AAAGCCTGCT ATAGTAGTTC TGTAAAOGAT TGCATGGTAT GCAAATATTA 2580 

ATGTACCAAA ATCGATAATT TATAGTATAA TTACGGCAAT AAGTTTTTTT ATGGATTTAT 2640 

TTAGTATCAA TCAGAGATGG GGTAAGAAGT TATGGAGAAC AATGAACTAC AAAGGGGATT 270 0 

GAGTGCCCGT CAAATTCAAA TGATTGCACT TGGTGGTACG ATTGGCGTGG GGCTTTTCAT 276 0 

GGGTGCGACA AGTACAATTA AATGGACAGG CCCATCAGTT ATCCTTGCAT ATTTAATTGC 2320 

GGGTATCTTT TTATTTTTAA TCATGAGAGC AATGGGGGAA ATGATTTATT TAAACCCTAC 2880 

AACAGGATCA TTTGCAACAT TTGCAAGTGA TTATATACAT CCTGCAGCAG GTTATATGAC 2940 

25 AGCATGGAGT AATATATTCC AATGGATTGT AGTTGGTATG AGTGAGGTCA TCGCAGTAGG 3000 

AGAATATATG AAGTTTTGGT TCCCGGAATT GCCAACTTGG ATTCCTGGTG TTATTGCTAT 3060 

TTTATTATTA ATGGCAGCGA ATTTATTCTC GGTAAAAGCG TTTGGAGAAT TTGAATTTTG 3120 

30 GTTTGCTTTA ATTAAAGTTG TAACAATTAT TTTAATGATT ATTGCTGGTT TTGGTCTTAT 3180 

nnTCmXGGT TTTGGAAATG GTGGCCATGC GGTAGGTATT TCTAATCTAT GGACAAATGG 3240 

c 

(2) INFORMATION FOR SEQ ID NO: 646: 



20 



35 



ii) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1311 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



3241 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 646: 

AGGCGTCAAC TCAGATGGTT TAATAATTGC CGTATTACCT GCTGCAATAG CACCGATTAA 60 

AGGTtCGAaC ACTAGTtGAA AAGGATAGTT AAA7GGTGCA ATGATCAAAA CTGTTCCATA 120 

AGGTTCTTTT TTGATATAGC TTTTTGTTGG AAATAAATAT AAAGGTGTGT CTACATTlcTT 180 

TGTTTTAGTC CAGTTTTTAA GTTCcTTACG GGCAATTTTG ATACTTyTCA AAGTTATGCC 240 
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AATATCGCTC TCGTATGATT TAATAGCTTT GCTTAACTTC TTTAATTGCT CTTTTCTAAA 360 

ACTAATATCT TTAGTTTGTT GTGTATTGAA AAAAGCTTTA CTGTCATAAA ATTTTTGCTC 420 

AATGATATTC ATAATGAAAA GAACCTCCTT ATATGATTAT TTTGGAAAAA GCGATTAATT 480 

GATTTGAATG TTGTGGCCGT TAATTTTAAA TGGTCTTTCG AATTATATAT GTTGAAAGTT. 540 

GAAAATAGAG CGATGAATCG TGTACATAAT AATATTTATA ACTTTAATCA TAACGAAAAA 600 

GGTAGGAAGA AAACAAAAAT TTATACTCAA CATCGCAAAT ATTTTAAGAA AATGTAAAGA 660 

CAAAAGGGGA ATTGTATAGA AATCACTAAT CTGTGGGTTA GGGTAGCTAA AGGAATAAAA 720 

ACTACTATTG AAAAAGGGTT GTAAATTAGT CAAACGTAAA TAAAAAACAG TTCATTGAAA 780 

GTGAAATAAA TTCTACTTTA ATGAACTGTT AGTTAAATAC AACATGTCTA TAATTAGACA 840 

GTAATATAGT ATTATTTTGT TAATGCTTCA GTGATTTGAG GTACGATTTG TTTTTTTCGA 900 

GAAACGACAC CAGATAAGAA GGCCATGTCA TCTTCTAATT GAACATTGAA TGtTCGCCAA 960 

CTTTATCTTT TTCAGCACCT ACAACTAAAA TTTTAGAATC ACTATTAATG ATGTCAGTAA 102 0 

CAACAAGTAC AAATAAGTCA TATTTTTCTT GTGCACTTAC AGCTAACATT TCTTTTTCTA 1080 

25 rATCTTCTTT ACGATTTAAC ACTTCGTCAA GGTCAACAGC ATTAACTTGT GCAATACGAG 1140 

TCACATAGTC ACCCATAGTA AATGATTTAG CATCCATGTT TAATAAGAAT TCAACTGATT 1200 

TATCAGTTGT TGAAGCACCT GCTTTtAACA TATCTAAGCC GTACTTTTGA ATATCAACTT 1260 

TAGCAATATC TTTnAATTCT tCAGCTGCTT TAACATCTTG TTGTGTACAT G 1311 
(2) INFORMATION FOR SEQ ID NO: 647: 
(i) SEQUENCE CHARACTERISTICS: 

35 CA) LENGTH: 1490 base pairs 

(B) TYPE: nucleic acid 
(C> STRANDEDMESS : double 
(D) TOPOLOGY: linear 

40 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 647: 

CATATACTTT TTCATTTCTT TACGAGATAC TTTACCAGAG GATTTAGACT TCATACGCTG 60 

45 ATCCATATGT GCTTGCGTTT CAGaATGTCC ACAAACACAA CGATATACCG CTTCTTTCCC 120 

TTTACCAAAC AACGTTAATT TCTTTTTACA GTTTGGACAT CTTGCATTTG TTTTGCGCTG 180 

TACATTCTTT TTCGTCTTAC AAGATGGATC TTGGCACACA AGCATCTGAC CATTTTTAGT 24 0 

TTTAACTTTA ATCATGAATT TACCACACGT TGGGCATTCT GTGGTTGTTA AATTATCGTG 300 

TTTATATTTA CGATCACTAT TTTTAATCCC ATTTACAACA TCTTTCGTAA AATCTTTCAT 360 
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CCATTGTGcA GTTAAAAGTG GCGACGTTAA TTCTTCTGGT GCTAATTCTA ATATTTGTTT 480 

ACCTTTTGAC GTTACnTAA TTTTACCGTC TCTTGATTCA ATGGCATTCA TATTAAATAA 540 

TTTATCGATA ATGTCGGCCC TTGTTGCAAC TGTGCCGATA CCACCTGTTT GTTTTAAAGT 600 

TTGCGCATAT TTTTTATCCT TCAATTGAAT AAAGTTCTGA GGGTTCTCCA TCGCTTTTAA 660 

TAACGAACCT TCATTAAAAT ATTCTGGAGG TGTTGTTTCA TGTTCTCTAA TATTTGTTTT 720 

TGAAATCTTC ACTTCATCGC CTTCTGAAAA AGGCTGTTGC ATCTCTGTAA TAGATTCACC 780 

TTGTCTAATA GATTTAAAAC CTAAAACAGT TGTTACATTC TCTTTCAAAA CAAATGTGTG 840 

^5 CCCTGCAACC TCTAAAGTTA CAGTTATCGC GTCATACTCG TGCGGAGGCA TTAAAGCTTC 900 

TAAAAAACGC TCGACAATCA TATCGTATAA CTTTAATTCT CTATTACTTA AGTCTGACAT 960 

GACAGGTCTC ACTTCTGTAG GAATAATTGC ATGGTGATCA GATACTTTTT GATTATTAAA 1020 

20 TATCGACATT TTTGATGAAA ATGTTTTAGA CATTAATGGG CGTGCTTGGT CTTTATATGT 1080 

TGTTGCCATC GTCACCTGAA TACGTTCTTT CATAGTATCT ACCATATCAG TTGTTAAATA 1140 

GTTTGAATCT GTTCTTGGAT AGGTTACGAC TTTATGTCTC TCATATAAGC TTTGAAGTGT 1200 

ATTCAATGTT TCTTTAGGTC CAATTTTATA ACGTCTATAC ATATCTTGTT GTAAATCTGT 1260. 

TAAATTGTAC AGTGATTGCG GATACGACTT CTTATGTTTA GTAGCAACAG ATTTAATCTT 1320 

ACCATCGACA TTTTTCAAAT TATTAACCAT CTGTTCTAAA GTTTCTTTAw TGGtATATCG 1380 

CTGATTTGaw TCTAGCTGAA AATCAAACCC TTTTACCGTT AATGATAATG TAAAGTATTG 1440 

TTGTGGnTTG AACTGATTAA TCTCTTGTTG GTCGTGTAAT TTACTAAATT GAAACGGn 1498 
35 (2) INFORMATION FOR SEQ ID NO: 648: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1044 base pairs 

(B) TYPE: nucleic acid 

40 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



25 



30 



(xi) SEQCJENCB DESCRIPTION: SEQ ID NO: 648: 

45 

TAAAACAATT CGTTTTATTA ATACAGTTTG TAAAAGTATT CTCTTAGTAC TAATAGCTAA 60 
TGTAATGATA GAAAATACTA GTGTTATTAA AGATTTGAAT AAAATAAAAG AAACTGAGAA 120 
SO ATATTGGAAT GTATTAGATG ATTATTACAC GATTGAATTT GCACCTTATC ACGAAACAAA 180 
ACAAAGTTTG ATTGATAATA TGGTGCGATC AGAACAATTA GTAAAGGCTA GTGAAGCAGA 240 
AAATAATGCG ATTTTATTCA AACCAAAGGG TGACTCCGTT GACAATGACA ACTTTTCGCC 300 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 650: 

GTACTAGGTT CTAnGATTCC CTACTGTAGT CATAGATATT TTCCAAACAG AGCCTGACAA 60 

CTTTTCATTT TTAATAGTGA TCACTATATT AATCGCTATT GCAATTTATG CATGTCGATT 120 

TGTTTGGGTT TATTTCTGGT ACAAAGATTT TTATTTCCCG AAAAATATAC AATCTTATCT 180 

AGACGAGGAA CATGATTCAC ATGAAACACC ACCTTCTCGA GTGCGTTACG CATTTATTAT 240 

GACCATGTGT GGTATTCACG GTACAATTTC ACTTTCAATG GCACTTACAT TACCATTTAT 300 

CATTACAAAA GGACAAGCAT TCGAATACCG TAATGATTTA TTGTTTATTG CATCTTTCAT 360 

GGTATTAATT AGTTTAATCT TAGCGCAAAT TGTTTTACCT TTAATTACAC CATCTGCCGA 420 

AGATACTACT TTTAAAGGTA TGACTTATCA ATCTGCCAAA ATTTTCATTG TTCAAAAAGT 4 BO 

GATCCAGCAT TTTAAAAACG AAAGTAAAAA AGACAAAAAC GATACAAATT ATCGCCCAGT 540 

20 ATTAAACCAA TACTATGGAG AATTGTTATT TTTATTAAAT TCAGAACCTG ATAATCAAAA 600 

TACrAAAGAa CTCAAACGTT TAGAAGATAT TGCaAAAGTA ATCGAAACAT CTACACTTGA 660 

GCGTTTAATT GATAAAGGTA AGGCAACATA TCAGGATATT AATAATTACC GCAATATTGT 720 

CGAATTAACA GAGACACACC GTACTGC 747 

12) INFORMATION FOR SEQ ID NO: 651: 

(i) SEQUENCE CHARACTERISTICS: 
30 (A) LENGTH: 1373 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNES5 : double 

(D) TOPOLOGY: linear 

35 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 651: 

ATACAATACT CT.TTTATTAT TCAATAAGCC ACTTCCTATA GCAAATGTTT AACTTTAAAT 60 

40 ATTTTTCGAT GCTAACAAAA AATCACACTA TCATCTTTTA AAATGAAAGT GTGATTACAA 120 

GCAAATCTGT AAAATTTATA AAGCAGAAAC AATTCAACTT TATCATTATG ACATTTCAAT 180 

TAAACCTTCT ACATTATAGT TCCAAGCATC TTACACATGA ATGCAAGTAT TTAACGATTT 240 

AATTGTGACA TAGCCTGTTG ATATTGTGTT TCATTGATAT AATTTTGTTG CTTCATTTTT 300 

TCTAAGTTCG TGCTTACACG TTGCGTAAAA TTCTCTGACA TATTATTGAT ATTATATACG 360 

CTAGGTGCAT TGACTTTACT AGCTAAAATA GCGCTTTGTA AAACTGTTAT GTGAGACATT 420 

GTTGTACTAT TTTTATTCAC GGTTGTTCCA AAGTAATGGT TTGCTGCGCC CTCAAGCGTA 480 

TATTGATTAT CCCCAAAGTA AATATTATTT AAATAAAAGC TTAAAATTTC GTTCTTATTA 540 
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10 



TCATTATCAT AAAi^ATAATT TTTGACAACT TGTTGTGTAA TGGTACTACC ACCTTGCACA - 660 

TCrCTGTCGC TAATCGTTGA AAATAAAGCT CTAGTTGTAC CTTTCAAATC GAATCCATGA 720 

TGATTGTAGA ATCGTTCATC TTCCATTGAA ATAAAGGCAC CTTTAACATA CTCTGGCATG 730 

TTATCAGCTG ACACAAAACT ACTTTTATTT TCAATTTTTC TTAGTTCATC CACATTATCG 840 

CGTGTAGATA AAAAATACAT GATACCAATA AACAATGCGA TAATGATTAG AATGGTTAAT 900 

AATATTTTTA ATAGTATTCG TTTACTTTTT TTCTTTTTCG GCGGTTTGCC AACTGGTTGA 960 

TAATACGTAT TATAGTGAGG TTCGTGTTTC ATATGCTCAA AATGTTCATT TGAGTTTGAG 1020 

TACCTATCGC TTCTTTTCAT GCGTTTGCTC CTTCTTTTAA AACTCACTTA GtATATACCT 1080 

TGaGTTTACC AGTACTATCA CAAATAGGCT ACACTTTTTG GGAAAATCAG TCCAAGGGCT 1140 

TACAATCGTA TACGCCATCA TACTTACTTT TTTGTTTTTT GAAAAAATTA TAGATAAATC 1200 

^0 ATTGCAATTT TAAATATTAA TCATGTCAAA TATTGTTATA TTTTATAAAA ATAAAAGACC 1260 

ATCCCTATTA AATGCCAATA GAGACGACCT TTTATTTGTT ATTCATTTAT TAAAACTAAA 1320 

ATCCATATTT CATTTCAAAC GAAAATATAT AAATTTTAAC AATCGrTAAC CAC 1373 
(2) INFORMATION FOR SEQ ID NO: 652: 



15 



25 



ii) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 859 base pairs 
(3) TYPE: nucleic acid 

(C) STRANDEDNSSS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: €52: 

GGCAGATAAT TTAGTCATTG TTGAATCGCC TGCAAAAGCA AnAACCATTG AAAAGTATTT 60 

AGGTAAGAAA TATAAAGTTA TAGCTTCAAT GGGACACGTC AGACACTTAC CAAGAAGTCA 120 

AATGGGTGTC GACACTGAAG ATAATTACGA ACCAAAATAT ATAACAATAC GCGGAAAAGG 180 

TCCTGTTGTA AAAGAATTGA AAAAACATGC AAAAAAAGCG AAAAACGTCT TTCTCGCAAG 240 

TGACCCCGAC CGTGAAGGTG AAGCAATTGC TTGGCATTTA TCAAAAATTT TAGAGCTTGA 300 

AGATTCTAAA GAAAATCGCG TTGTTTTCAA CGAAATAACT AAAGACGCTG TTAAAGAAAG 360 

TTTTAAAAAT CCTAGAGAAA TTGAAATGAA CTTAGTCGAT GCACAACAAG CGCGTCGAAT 4 20 

ATTAGATAGA TTAGTTGGCT ATAACATCTC GCCAGTTCTT TGGAAAAAAG TAAAAAAAGG 480 

GTTGTCAGCG GGTCGAGTTC AATCTGTTaG CmTTCGTTTA GTCATTGACC GTGAAAATGA 540 

nATTCGAAAC TTTAAACCAG AnGAATATTG GACTATTGAA GGAGAATTTA GATACAAAAA 600 
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aAAAGATGTT GAGAAAATTA CAGCTGCATT AGATGGAGAT CAATTCGAAA TTACAAACGT 720 

GACTAAAAAA GAAAAAACGC GTAATCCAGC AAACCCATTT ACAACTTCTA CATTACAACA 780 

AGAGGCGGcA CGTAAATTAA AcTTTmAAGC AAGAAAAACA ATGATGGTCG CACAACAATT 840 



ATATGAAGGT ATAGATTTG 
(2) INFORMATION FOR SEQ ID NO: 653: 

10 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 747 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 653: 



20 


TTCAACTTCG 


TTTGGAAATC 


ATGTTCCTCA 


ATTGTTGGAC 


TTAAACGAAT 


TTCTTTAACA 


60 




TTGATAATTT 


TTTGTTTCTT 


TTTCATTTCT 


TTTTCTTTTT 


TCTGTTGTTC 


GAATTTGAAT 


120 




TTACCGTAAT 


CCATAATTCT 


TGCAACTGGT 


GGTTTCGCAT 


TCGGTGCAAC 


GACCACTAAG 


180 


25 


TCTAAATCTA 


CACGTTCAGC 


CATTTCTAAA 


GCTTCACGCT 


TTGATTTAAC 


ACCAATTTGT 


240 




TCACCATCTT 


GACCGATTAA 


ACGTAATTCT 


TTTGCACGAA 


TTTTGTCATT 


GATTTGAGTT 


300 


30 


TGATCTTTTG 


CTATGGTTGA 


CACCTCCAAA 


ATTTTTACGA 


AATTTGCACC 


AAGCAAAAAG 


360 


GAAGAGCAGG 


TATAAAATAC 


CCGCTCTTCC 


TTATACACAG 


TTATGTGTAA 


TGTGATTAAC 


420 




CTGCCAACTG 


CTTTATGCGT 


CGCTACAGGT 


GAGAAGCGGG 


TGCTTCTACT 


TGGTTCGTTT 


480 


35 


CGTATTCAAC. 


GTTATTAATC 


ATATCAACAA 


TTCACATTTA 


AGTCAACACT 


ATAACTGTAA 


540 




TTATTTTTAT 


TTTAACCTTT 


TATTTCATCC 


ATTGACACGT 


CTTGACGTAA 


ATCTACTTGT 


600 




TCTAATGGAA 


TTTTTTTCGT 


TTTATATCGA 


AGCTTATGAT AAATAAAGAA TGCTAAAAAT 


660 


40 


ACTGGAATTC 


CCATATACGT 


AATTAAGAAG 


CGACTAAAAT 


TAAAATCTCC 


TGTnTTAATA 


720 




AAGTCAACAT 


CTTGCCCAAn 


AAnTACT 








747 



(2) INFORMATION FOR SEQ ID NO: 654: 

4S 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 501 base pairs 
(3) TYPE: nucleic acid 
(C) STRANDEDNESS: double 

ID) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 654: 
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TTGTGCrXCT TTTTTAGCTT CTTGAACCTC TTGTGCCTCT TGTGATGTAT CACTyAAATT 120 

ATTTGCACTT GCTTCTTCTT TTATCGCTGC TTGTTGTGCT TTCAATGCCA CTGCTTTTGr 180 

TTCTTyATTT GATACAGCCA CACTTTTATC CGCTTCTGCT TGTGCTTCTC TTTTAGCTTC 24 0 

TTGAATCTCT TGTGCTTCTT GTGA7GTATC ACTTAAATTA TTTGCACTTG CTTCTTCTTT 300 

TATCGCTGCT TGTTGTGCCT TTAATGCCGC TTGCTCATTT TTAGATTTGT TTAAAAATCC 360 

TTCAACACGT TCTTTTGTAT AGGCAACCGT TTCTTCAAGT TGCGTTTTTC TTTCTTCAAA 420 

CTTTTGCGAC AGTTCTTGTn CTTTGACTTT nAAATCATCT GCTTTTTGAT AAACTTTATT 4fl0 

TTAAAATACC AACCTAAAGC C 501 
(2) INFORMATION FOR SEQ ID NO: 655: 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: B30 base pairs 
20 (B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 655: 



CACCTTGTCA TAATTAATTT 


TTTGATTTTT 


CATTTTACTG 


ATAATAGGTT 


CAGCATTAAT 


60 


CATGATTTAA CCTCCCACAT 


TTAATCATTA 


ACTTCTATTA 


TATATGATTC 


ATATTAAATG 


120 


TCAGTCAAAA AAGTTAGAAA 


TTCATTTTAA 


TGCATTTATA 


TTTCGAAAAT 


CCCTTATGTA 


180 


TCTAAAAGCA TTTTTTAAAC 


TTGAATTTTA 


AAACACTAAA 


CAACACATAC 


GTCTCTGTGT 


240 


CATTTTCATT TTTTGTATGT 


CATATATATG 


TTTACTTCAT 


TTAAATCAAT 


TTCATCTTAT 


300 


AATTTATCGT GTATTTTACA 


AAAGATTGAC 


TTCAATTCAT 


CGTAAAAGTT 


ATACTTTTGC 


360 


CATTTTTTAA TGTAACATGG 


TGTTAGTAAT 


AAAAATAATA 


CATTGAGGTG 


TTTTACATGA 


420 


CAGCATTATT CCCTTATATC 


GCTTTTGAAA 


ATTCAAAAGA 


AGCCCTTGCA 


TATTACGAAG 


480 


AAGTATTTGG TGCAACTGAC 


GTTAAACGTT 


TAGAAGTTGG 


CGAAGAACAA 


GCGTCACATT 


540 


TTGGTATGAC TAAGGAAGAA 


GCGCAAGAAG 


CAACTATGCA 


TGCTGAATTT 


GAAGTGCTTG 


600 


GCGTAAAAGT GTTATGTTCT 


GATTCTTTTG 


GTCGCGCTGA 


CAAAATTaAT 


AATGGCATAT 


660 


CATTATTAAT TGATTATGAT 


GTTAACAATA 


AGGAAGATGC 


TGATAAAGTT 


GAAGCATTCT 


720 


ATGAGCAAAT TAAAGATCAT 


TCTTCAATTG 


AAATAGAATT 


ACCGTTTGCT 


GACCAATTCT 


780 


GGGGTGGCAA AATGGGCGTC 


TTTACCGATA 


AATACGGTGT 


TCGTTGGATG 




830 



(2) INFORMATION FOR SEQ ID NO; 556 
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(A) LENGTH: 539 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 656: 

GXATCCATGG GCCCGTTnCG CACAACATTT GGnACAATTA GGTACACGnG TTGTCaTCGG 60 

TCGTTTCGGT ATAATTTTAT CGAATGaAGG CGGTGCGTTA CAAACAATGA AACTACCATA 120 

CGAATATTAC ATTGGTGGTA AATTAGGTTC TGGTCAACAA TGGTATTCAT GGATTCATAT 180 

IS CAATGATTTA ATTCAAGCTA TTTTATTTTT AATAAATAAC GAGTCAGCTA GTGGTCCGTT 240 

TAATTTAACT GCACCTATAC CTGAACGTCA AAATTTATTT GGCTACACTT TAGCAAGAGC 300 

TATGCATAAG CCTCATGAAA CTTGGGCACC AAGTCTTGCA ATGCGTCTCA TACTTGGTCA 360 

AATGTCAACA GTAGTATTGG ATACTCAAAA AGTATTACCT aATAAAATTC AAGCATTGGG 420 

aTTCCAATTT AAATATAGTA ATTTAAAAAT GGnACTTGAA GATTTAATTA AAGAATAATC 430 

AATACCATTA ATGAGCATTA GAAACAACAT ATGTACTAAA TGTAATGTCT AGAGCGACT 53 9 

(2) INFORMATION FOR SEQ ID NO: 657: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1106 base pairs 
3Q (B) TYPE; nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



{Xi> SEQUENCE DESCRIPTION: ! 
ATCAAGTTGA ATATCATCCA TATTTAACCC 
AACGTATCGT gATGGaATCT TGGTCACCAT 

40 

CAATTAAAGA CATTGCTCAA GAATTAGGAA 
ATGTGCAGCA TGCTGTGGTT ACAATCCCTA 
ATTTCCAAAT ATTTGATTTC GAATTATCAG 

4S 

ATCAAGATAA GAGAATTGGA CCTGATCCAA 
AACTGATGAA AAGGTTAGAT GAATTGTCAG 
SO AAAAAAGCTG ATTTCTATTA ATTATTTGAT 
AATGTACAGC TCGTTGAGCT GCTATTTTCC 
GCTCTCGTTT AACTTTATTT AtTCCTCGAA 

55 



EQ ID NO: 657: 

AACATAAATT GArATTATAT TTGGCAGCAC 60 

TGATGAATGC ACAAATTTTA AATGATGAGA 120 

AGTCACCTGC CCAAGTTGTT TTAAGATGGA 180 

AATCGGTGAC ACCAAACAGA ATCTCTGAAA 240 

ATGAACAAAT GACGCGAATT GATGGTTTAA 300 

AAAAATTTGA AGGCTAGATT AAAATCGCTC 360 

GGCTTGGGAC ATTAAGTTCT TAGGCAATGT 420 

AGAAATCAGC TTTTTTGATA TGTATTTTAT 480 

TTATATTAAG TGCCATTAAT ACAAAACCTA 540 

CTGACGTTCG AGTTAAACCC AAAATAGCCT 600 
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CTGGTTCAGA AAGCTTTTGA TTAATTTGGA CTTTAAAGTA TTCCCAATTA TAATTCTTCA 
TGATTtTCTT ATTGGATTTT GAATTTGGTT TCATGCATTG TTGCCTCAAA GAACATGCTG 
AACAGTCATC GCATTCATAT AGTTTGAAGT CTCGTTTAAA ACCATATCTA TCATTACGGT 
ATGCATATCT TTTAAAACCT ATTCTTTTGT TATTAGGACA TATAAATTCA TCATTAAGTT 
CGTCATATTT CCAATTTTGA GTGTCGAAAA TGTCACTTTT AAACTTTCTA GTTTTATCtT 
TAATAAACAT GCCATACGTA ATAAGTGGCG TTTTATTAAA ATCATCTATA ATGGCCATAT 
AGTTTTGGCT CACTACCCAT AACCTGGCAT CAGCTACCAA ATGAACCGAA GGGATTTTTG 
GAATCCATTG GTTGAAAAAA TGGGAA 
(2) INFORMATION FOR SEQ ID NO: 653: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 400 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

• (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 658: 
TTTTAACTTT ACTCTTTGAT TTAAAGAGTG ATAAATGTTT ACAGTTTAAT TAAAACTGCA 
TAAGAACTTC TAGCTTTTCT CTTTCGTTCA AAGAGAAGCA GCTGTTCGCA GTTTAATCAA 
AACCACATAA AGCTTTTAAC TTTACTCTTT GATTTA?AGA GTGATAAATG mACAGTTT 
AATTAAAACT GCATAAGAAC TTCTAGCTTT TCTCTTTCGT TCAAAGAGAA GCAGCTGTTC 
GCAGTTTAAT CAAAACCACA TAAAGCTTTT AACTTTACTC TTTGATTTAA AGAGTGACAA 
ATGTTTACAG TTTAATTAAA ACTGCATAAG AACTTCTAGC TTTTCTCTTT CGTTCAAAGA 
GAAGTTCTAA TACCACCATA TCGTGCGATC GGGAACGGTA 
(2) INF0RZ4ATI0N FOR SEQ ID NO: 659: 
(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1399 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 659: 
ATAATTACAA TGGCTACTGC AATTATTGIT GGAATTATAT ATTTCAGTTT AGTCATCATT 
TATGCTCCCT TGATTTCAAA TTCATATCAT TAGTTTACCA TATTGAAGAT GATATAATAA 
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AACTTTAACT GAGCTTCATG GGGCACCAGG TTTTGAAGAA GAAGTAAAAA ATTATATGAC 240 

TCAGCAAATG GCGCCGTACG TAGATGAATT TATTGAAAAT CGTATGGGTG GATTTTTTGG 300 

TGTGAAAAAA TCTAAAAATC CAAATGCAAA ACGTGTAATG ATTGCAGCAC ATATGGaTGA 360 

AATCGGATTT ATGATTACAA ATATCACTAA AAATGGAATG ATTCAATTCA CAAATTTAGG 420 

TGGTGTTGCA AATGATATTT GGCAAGGACA ACGCTTAGTA ATTAAAAATA GAAATGGCGA 480 

TAAAATTATC GGTGTTGTTT CTAATATACC TAAACATITT CGTACTGGTA GTGAAGGTGC 540 

ACCGGAAATT AAAGATTTAA CATTAGATAT AGGTGCTCAA AATGAAGATG AGGTGCGTGA 600 

gCGCGGAATA GATATAGGAG ATACAATTGT ACCTCACACG CCATTCACAC AGTTATCTGA 660 

ACATCGATAT AGTGCTAAAG CATGGGATAA TCGTTATGGT TGTGTCTTGG CAATTGAAAT 720 

ACTAGAATTA TTAAAAGATA TAGAATTAGA TGTAGACTTG TATGTTGGCG CAAATGTTCA 780 

20 AGAAGAGGTT GGATTACGAG GTGCGAAAGC ATCTGCAGAG ATGATAGACC CAGACGTTGC 840 

ATTTGTAGTT GATTGTTCAC CTGCCAATGA CGTTAAAGGA AACCAACCAT TATCTGGTGA 900 

ACTTGGTAAA GGGACGTTAA TTCGCATAAA AGACGGTACA ATGATTTTAA AGCCTGTATT 960 

TAGAGACTAT TTATTAAAGT TAGTAGAAGC ACATGACATT GAACATCAAT ACTATATGTC 1020 

ACCAGGTGGA ACAGATGGTG GAGAAATTCA TAAAGCTAAT ATTGGTATTC CGACTGCAGT 1080 

TATTGGTGTA TGTGCACGAT ATATTCATAG TACAGACTCA GTATTTGATA TAAGAGACTA 1140 

TTTTGCAGCT AGATCTTTAC TTTCAGAAGC CATTTGTAAT TTAGATAATA ATCAAATAGA 1200 

AACATTACAA TATAAATAAT CGGGTAATAA CAACTATTAT CTCTAAATAG TTATATATAA 1260 

TCATTAATTA AGGAGACATA AAAATGAAAC AACTTGAATC AGAACAACAA TTTGAATCTT 1320 

TAAAACAAGG TGCTACAGTA TTTGAATTCA CTGCAGGCTG GTGTCCAGAT TGTAGAGTGA 1380 

TAGAACCAGA TTTACCGGAA TTAGAAGCGA GATATCCTAT GTTTGACTTC GTATCAGTAG 1440 

40 ACCGTGATAA ATTTATGGAT ATTTGTATTG AAAATGGTAT TATGGGTATT CCAAGTTTTC 1500 

TAGTATATAA AAATGGAGAA CTGCTTGGAA GTTATATTGG AAAAGAACGA AAATCAATTG 1560 

AACAGATAGA TGCATTTTTA GCTCAATACG TGTAATTTAG ACTAGAGAAA AACGGGGTAA 1620 

TACTCGTTTT TCTCTGTTAC TATGTGTTGA TTTATTGTAA ACTATTATAA GGTGCGAAAT 1680 

TAGGAGTGTT ACATATGAAT ACCTTTCAAA TGAGAGATAA ATTAAAGGAA CGTTTAAGCC 1740 

ATTTAGACGT TGATTTTAAA TTTAATCGTG AAGAAGAAAC TTTGCGTATT TATCGAACAG 1800 

ATAATAACAA AGGTATCACG ATTAAACTTA ACGCTATAGT CGCAAAATAT GAAGATAAAA 1860 

AAGAAAAAAT TGTAGATGAA ATTGTTTATT ACGTTGATG 18 99 
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Ci) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3774 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
<D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 660: 

GTATAATATC CTTTCAATCT GTTTTCATAT TTTATATATT TTTTAAATAT AAGTGCTAAA 60 

TGTrTTAACT AAAGCATAGA TTGACAAGAT GTTATACAGA ATTTCAAATT CTATCCAATA 120 

TTGTTCGAAG TGTAGTATCA CTGGATTGGT ATTAAACAAT GTAAAGGAGA GATTGCAAAT 180 

GCCGTATAAT TACAAGAAAC AAAATGGAGA GTTAATGTCT GTAATGAGCC AAGGTGAAAA 240 

GTTTATTCAT CAATCACCCG TTAATGATGA ACTTAGTGCA TTGATTAAGT TATTAATTTC 300 

20 TAAAATTAAC GGTTGTCATT ATTGTGTTGA TATCCATAAA AAAGAATTAA AGGAATTGGG 360 

TGTAaCACAA ATGAAAATTG ATGAAGTCTT GAGTTTTAGA CATTTAGATT TATTTACTGA 420 

TCAAGAAAAA GTGACGCTTG AATTTGCAGA AATGTTAAAT TCAATCAAAG ACTTTAAGAA 480 

GTTTGAAATT ATTGACCGGC TAAAATCATT TTATGATGAA GAACAAATTA TTGATCTTGT 540 

CTTTGTTGTA AACCAAATTA ACGGTTGGAA CAGATTAAAT ATTATTAGTG ATAGACTATA 600 

ATTGTTCATA TAAATGCAGA GTTTCATCTC GAACGCTATA TCATAACAAA TCATGCCACT 660 

ATACAGGTCA AATCTTGTAT AGTGGCATTT TAATTTATCC CTTTGAATAC TGTTATTTAA 720 

CGAATATCGG TCCACCTGGT CCAACAGGGA TACCTAATAG GAACCAAATG ATGACAAATA 780 

CTGTCCATAC AATACTTAGC GCGATTGAAT ACGGCATTAA ACTAGAAAGT AAGGCTCCGA 840 

GTTTCATGCG TTTATCGTAT TTTTGTGCAT AAGTTAATAA TAAAGGTAAG TACGGCATCA 900 

TCGGTGTAAT TGGATTGGTA ATTGAATCGC CTACACGGTA AATGACTTGT GTGAATGCGG 960 

40 GATGAAAGCC GATAAGGATT AACATTGGTA CGAATATCGG. TCCTAAAATA CCCCATTTAG 1020 

CCGATGCGCT TCCGATTAAC ATGTTGACCA TTGCACTCAG TACAATAATA CCTAGTATCA 1080 

ATACAATACC GTTTTGATGT TCTAATAATT TGGCACCTTT AACAGCAGCG ATAATTCCTA 1140 

AATTACTCCA CTTTAAATAC GCAAGTAGCT GTGCTGCAAA AAACACAATA ACGATAAATG 1200 

TTCCCATTGA TCCTACAGCA TCGCCGAACA TTTTACCTAA GTCTTTTGTA TTTTTAATTT 1260 

CTTTGCTTAA AATCCCATAA ACTAATCCAG GTACTAAAAA TACGACAAGA ATAATTAATC 1320 

CGACACCGTT AATTAATGGC GCATCGTCTA GTAAGCTGCC TGTTTTAGCA TTTCTTAAAA 1380 

AGCTATGTTC AGGAATGGCT GTAATAATTA ATAAAATAAT TGTGACTATG AAACTGATAT 1440 
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CATCATGCAT 


TAAACTGTCA 


TCATATTTTC CTAATCTAGG AATAATGAGC TTAGTTGTAA 


1560 


CTAGCAATAT 


CGTAGGAAGT 


AATACAACGA 


CACTCGCTGC 


GATAAAGTAC 


CAGTTCATAG 


1620 


CAACGTTTGT 


TTTAATAGAA 


TCTGAAACGA 


TACGTGTTGC 


CGGTTCTGTA 


AATGAATAGA 


1680 


CCAAAGCATC 

* 


TTGCATACCA ACAACTATAT TTGCTGCAAA TCCTCCAACA GCGGAAGCAT 


1740 


ATGCCATCGT 


TAGTCCAGCG 


ATAGGGTGAT 


AGCCAATTTT 


AATAAAAAGC ATTGCTGCAA 


1300 


GCGGCGGCAA 


GATAATTGTC 


GCAGCATCGC 


CGGCTGTACT 


ACCTAAAATA 


CCAATTAATA 


1860 


TAATAGTCGG 


TAAAATTAAG 


AAACGTGGTG 


CGCGATTCAC 


AACAGAAATC 


ATTAACTTAT 


1920 


CGAAGTATCC 


TGTTTTCTCT 


GCAACACCAA 


TACCAATCAT 


CACTGCTAGT 


ACTAAGCCTA 


19S0 


ATGCTGGGAA 


CTCTGAGAAA 


TTTTTAATCG 


TATCATTCAT 


TATCATCGTA AATCCATCAT 


2040 


GGCTAATTAT 


ATTTTTAATA 


TAAATGGTTT 


GATGCGTACC 


TGGATGCTTA ACAGATACAT 


2100 


TAAATAATGA 


GATAACCCAT 


GTCATAATGG 


CTAAGCCCAC 


ACACATTAAA 


AAGAATAAGA 


2160 


CGCTAGGATC 


TGGCAATTTA 


TTTCCGATTT 


TTTCAACACT 


ATTCAAGAAA 


CGATTGACGA 


2220 


TAGACCCCTT 


TTGTTGATGT 


TTTGATGTCA 


TCAATTATTC 


CCCCCTTTGT 


TAAATATTTA 


2230 


AAGTGTAACA AAAAATACTC 


TCAAAAGTAA 


CAATTTTCAG 


GAAATAAAAA 


AACTAATATT 


2340 


GTTAAATATT 


TTGAGTTATT 


CAATAGAAAG 


TGTATAGCAG 


AGTAGTTAAG 


ACTGCCTGAA 


2400 


GACTTATCTA 


TTAGGTTTAT 


GAAGCATCGA 


ACAGTGGAAA 


ATAAGGACTG 


TAAGTTTAAG 


2460 


ATATGTTGTA 


TAGGAGTGAC 


TGAATGAAAC 


GTTTGGAAAA TAAAGTAGCA GTCGTAACAG 


2520 


GAGCAAGTAC 


AGGTATCGGT 


CAAGCTTCTG 


CAATCGCTTT 


AGCTCAATAA 


GGTGCGTATG 


2580 


TATTGGCGGT 


AGACATAGCT 


GAAGCGGTAT 


CGGAGACTGT 


CGATAAAATT 


AAAAGTAATG 


2640 


GTGACAATGC 


GAAGGCGTAT 


AATGTGGATA 


ATGCAAGCGA 


ACAACAAGTG 


GTAGACTTTG 


2700 


TGTCTGACAT 


AAAGGAACAG 


TTTGGAAGAA 


TCGATGTGTT 


GTTTAATAAT 


GCCGGTGTGG 


2760 


ATAATGCGGC 


TGATAGAATT 


CATGAGTATC 


CAATAGATGT 


GTATGACAAG 


ATTATGAATG 


2820 


TAGATATGCG 


TGGGACATTT 


TTAATGACGA 


AAATGATGTT 


ACCTTTAATG 


ATGAATCAAG 


2880 


GTGGCTCTAT 


TGTTAATACG 


TCTTCATTTT 


CCGGACAAGC 


AGCAGACTTG 


TATCGCTCTG 


2940 


GATATAATGC 


TGCGAAAGGT 


GCAGTGATTA 


ATTTTACAAA 


ATCAATCGCA 


ATTGAGTATG 


3000 


GCCGTGATAG 


CATTCGAGCC 


AATGCGATTG 


CACCAGGTAC 


AATTGAAACC 


CCGTTAGTAG 


3060 


ATAAACTGAC 


AGGTACGAGT 


GAGGATGATG 


CAGGTAAAAC 


ATTTAGAGAA 


AATCAAAAAT 


3120 


GGATGACTCC 


GCTGGGACGT 


TTAGGTAAAC 


CAGAAGAAGT 


TGCTAAATTA 


GTAGTCTTCT 


3180 


TAGCATCTGA 


CGACAGTTCA 


TTCATAACTG 


GAGAGACGAT 


TCGAATTGAT 


GGTGGTGTGA 


3240 
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AATTATTTAA AATCGATATC CAGTGGAAAA GAATTTGGCA TGAAGTAGGC AATGTATGCA 3360 

TAITGTCGCA ATGAAAGACA TTTAAAGCGG AGATTAATTA ATCTTTGAAA ATCACATATT 3420 

5 

GTTCATTTGA AGTGTATTGC TTAAAGCTTG TTTTAACGTA TTGTAGGTCG TGCATCTAAT 3480 

TTATCAGAAT CTCGAGTTCA AACTTTTGGA GTATCTTTAA AATAAGCTGT ATTTTGTCTA 3540 

TTCTAATAAA TTAAGGAGAA TTTTATGTTA AAAGAAAAAG AAAGTTTTAG ATTGCTATAT 3600 

10 

CAAGCTATAA GAGAGATTGC AGATAAAATT GGAGATAATC AGTTAGAAAC TAATTCCGTT 3660 

AGTTTATtAT tATTGGACTT TGATTTTGAA CATGAAGTAT TTGATGAATT GTATCTTGTG 3720 

75 ATTTtAAAAT AXTTAAATAC AGTAAGTATA GAGAACATAA GTCATAGTGA GCTT 3774 
(2) INFORMATION FOR SEQ ID NO: 661: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1078 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



25 

• (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 651: 

TACTGGrriT GGATTTTGGA GGTAATACAG TACCTAATAG TAATnATGGT GTCGTCAnAA 60 

TTATATCTTT CCGTGATGTT CTTACTCATT AGAACATCnG CCTTCAGAGG AATCATGATA 120 

30 

CGAGGAATAA GAAATTTAAA TGTGAGCGAA GTCAATATAG TATTTGCGAT TATTTTTATT 180 

AACTCCATTA TTATTGTTAG TTTGATTTTT CGAGGATAAC TTCAATTTTT GCATTTTGAG 24 0 

GTTTTTTAAC ATATCTATTT GCATCAGTTG ATGGCAACCT TTTACTTAAA TCTATTGTGT 300 

AGTTATTGTC TGCACCTGTT ATTTTAATTT GTCCTTTATT ATAAGAATTA TTATATAATT 360 

TTTTACTTTT AATTAATGTT TGACGAATAC GAAAATCTAA TTCTTTTAAA GTTAAAACAG 420 

40 GCTTATTGCC TTCATAAACT GGAAATCCGC CAGTAAACGT TTCTGCTTTA TCTTTATATG 4 80 

TTACATTCAG TTTATAGTGT TTATCGTTAG ATGTTGCTGC AGGAGTAACA CCACCAGTAA 540 

ACGTTTCTTG AGATAATGCA AAAGaATCAA TGGTTTCTTG GTCTTTTATG CyAAAAATAT 600 

45 

CAACGCTTTT ATTTCTTAAT TGGTTGATAT TGCCCCAACT TTCAGGTCCA TAAACTTGAA 660 

TATGACTATA CCAAGaAAAC TGTAACAACG TTGCATGAAT CgTACCGTTA TCTTTTTGCC . 720 

ATAACGTACT GTTAGAGAAG GTTAAATATT TTTGCGAGTA ATATTTAGTT AACTCATTAA 780 

SO 

CGTTAGTTTC GTTTTGATTT ATATAAtAAG cTTTCGCTTC AGATGAAGAA TTGATAkGTG 840 

TATTAGGAAA TTGTGTAGAT GCTGTACCTA ATAGTAACAA TGTTGTTGAT AAAATAATTT 900 
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ATAAAAAGGG GTTAATTAGA TAATTGAAAT TATCCGCATT TACAAAAGGT AATAGGTTAG 1020 
TTAGATTTTT CGAGTATGAC TcAATTTCTG CATTACGAGG ATTTTTAACA TAACGGTT 1078 
^ (2) INFORMATION FOR SEQ ID NO: 662: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1398 base pairs 

(B) TYPE: nucleic acid 
10 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



75 



30 



(xij SEQUENCE DESCRIPTION: SEQ ID NO: 662: 

AACTTGCTTT TTAGTATCTA CGTTAATATT AATAGCTTTA ATTTCACTTG TATTAATTAA 60 

ATCAGCTGTG TAAATACCTG CTTTCAAATC GATAACTTTC TTTGTTCCAT TTTTAAAGTA 120 

20 AACAGTATAT TTCGCTTGCT TCGATAGTCT TAAATCTATA TCACTAATAC CTCTGTCTGA 180 

TTTTAAAACT GATTTAACTC TATCCTCTAA ATCTTTATAA CTAATATTTT GATTCTTATT 240 

AAATGTTAAG CTTGATAAAA TATTTTGGCT TGTACCGTTC ACAGTGaTTG CATATGGAAC 300 

2S ATGGACTTTA GAATATCCAT GGTGTAACGA ACTTGATGAT TTATCTAATG GCTTAGCTGC 360 

GGCAGACGCT TCATTATTAT TAAAGTTTGC ACCTGTTGAT GCTAAAACAC CTAATGCTAA 420 

AGTTGTTGTA ATCAATGACT TAAATTTCAT AAATTATCTC TCCTTTTTTG TGTAATTCGT 480 

ATTTGCAACT TAATTATAGC CAGACTTTCT CTATTTTTTG AATTAACTGA ATATTAATAA 540 

TAAATTATCT TTAACAATAA TTTTTTAACA CTGTTAAAAG TTCTTTTAAT TTTGATTAAC 600 

TAATTAATTT ACAATACCTA AAATGTTGTT TGGTTTTGTT TATACCAAGC TTCAAACTTA 660 

AATGTCATAA CAACATTCAT TTCTTAATTC CTATTAGATT TGTCGATTAT ATTTACAGCA 720 

TCTTTATACT CAAAAAACAT TTACTTAAAA ATATAAATTC GATTTAATAA TTAATTTAAA 780 

TTTAGTTAAT CAATTTTGCA TCTATTTTGT TGTAAGCTAT ATAAAAGGAG TGATAATGAT 840 

GGTGAAAAAA ACAAAATCCA ATTCACTAAA AAAAGTTGCA ACACTTGCAT TAGCAAATTT 900 

ATTATTAGTT GGTGCACTTA CTGaCAATAG TGCCAAAGCC GAATCTAAGA AAGATGATAC 960 

45 TGATTTGAAG TTAGTTAGTC ATAACGTTTA TATGTTATCG ACCGTTTTGT ATCCAAACTG 1020 

GGGGCAATAT AAACGCGCTG ATTTAATCGG ACAATCTTCT TATATTAAAA ATAATGATGT 1080 

CGTAATATTC AATGAAGCAT TTGATAATGG TGCATCAGAC AAATTATTAA GTAATGTGAA 114 0 

AAAAGAATAT CCTTATCAAA CACCTGTACT CGGCCGTTCT CAATCAGGGT GGGACAAAAC 1200 

TGAAGGTAGC TACTCATCAA CTGTTGCAGA AGATGGTGGC GTAGCGATTG TAAGTAAATA 1260 
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CAACAAAGGC TTTGTTTATA CAAAAATAGA GAAAAATGGX AAGAACGTTC ACGTTATCGG 1380 

TACACATACA CAATCTGA 13 98 

^ (2) INFORMATION FOR SEQ ID NO: 663: 

(i) SEQUENCE CHARACTERISTICS: 

<A) LENGTH: 1200 base pairs 
(B) TYPE: nucleic acid 
10 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 663: 

IS 

TTGTAATTGG AACGTACGAA CTTTTCTAGG TAAGAAACGT CGAATCTCGT CCTCATTATA 60 

ACCAACTTGT AGTCGTTTAT TATCTAAAAT AATTGGACGA CGTAATAAGC CAGGATTATC 120 

20 TTGAATGATT GAATATAAGT CTTGTAATGG TAGTGAATCA ATATCAACAT TTAATTTTTG 180 

GTATGTTTTA GAACGTGTAG AAATGATTTC ATCAGTACCG TCTTCAGTCA TTTTTAATAT 240 

TTGCTTAATT TCATCAATTG TTAAATGTTC AGAAAAAATA TTACGCTCCG TATACGGAAT 300 

25 GTCcATGTTC tTGkTAACCA TGCTTTCGCT TTTACGGcAA GATGTGcAaC TTGGtGaAGT 360 

aAATAATGtT ACCATACATC TCACTCTCCT ATTTGAATGA ATAAAATTCA TTGCTTAAAA 420 

TTTAGTTATA GATCAAGAAA AAACATTTTT TTCTAAAATT CTTAATCGTT ACTATTTATT 480 

30 

ATAACTATCT AACATTAAAA TTAAATGAGA AAAACCTAAT TTTTCAGATA AGTTTCTACA 540 

CTTATAAAAA AGATTATTAA TCCCTTTGTT AGTAGTAAGT TATACGTATA TTCTAACACA 600 

TCTTACATTT TTAAGAAATA CTGTTATAAT GATAATTATT AAAATATTAC TAAGAAAGTA 660 

35 

GGCATTTAAA TGGAGACATT ATTTTCAGGC ATCCAACCTA GTGGAATTCC TACTATTGGA 720 

AATTATATTG GCGCACTAAA ACAATTTGTT GATGTGCAAA ATGACTATGA TTGTTATTTC 780 

TGTATCGTAG ATCAACATGC AATTACAATG CCACAAGATC GTTTAAAATT ACGTAAACAG 840 

40 

ACCAGACAAT TAGCAGCGAT TTATTTAGCT TCTGGTATAG ATCCAGACAA AGCAACATTG 900 

TTCATACAAT CTGAAGTCcC TGCACACGTA CAAGCAGGAT GGATGTTAAC TACGATTGCT 960 

4S TCTGTTGGAG AATTAGAGCG TATGACGCAA TACAAAGATA AAGCTCAGAA AGCAGTTGAA 1020 

GGTATACCTG CTGGTCTATT AACATATCCA CCTTTAATGG CAGCTGATAT TGTTCTTTAC 1080 

AATACTAATA TCGTTCCAGT TGGAGATGAC CAAAAGCAGC ATATCGAATT GACTCGTAAC 1140 

SO CTTGTAGATA GATTTAATAG TCGCTATAAT GATGTGCTTG TGAACCTGAA ATTCGTATGC 1200 
(2) INFORMATION FOR SEQ ID NO: 664: 
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(A) LENGTH: 787 base pairs 

(B) TYPE: nucleic acid 
iC) STRANDEDNESS: double 
(D) TOPOLOGY: linear 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 664: 
TGTACCTTTT GCTTTAATAA ATACTGTTTC TTTATCATAA TTAGGTTCAG TTAAGAAATT 
AAATTGTAAG CTTTGAGTAA TATTTTTTTG ACTATCACTT GTTGTAGCTG TACGTGTATA 
CATTTTAGTA TCACCATCAA GATTCTTCTC AGAAACTTGT TTGATTTCAG AATTAATCTT 
TGCAAATGAA GTAGCTGGTA ATACAGTGAA AGTAGTCGAT AGTGCTAAsG wACAAATTGT 
GATATTTTTA CATAGTTGTT TAATCATTAG TAATCCGCCC TTTCAATATT ATCCTTCTTT 
ATAAGGTTTA TTGTCATCAG AATATTTATC AACGACTTTA ACTGTTTTAT TTTTCCAATC 
AACTTCATAA GTGACAATTA ATCTTTGACC ATCTTTATTT TtCTCTAAAA TTGGAGGTGC 
ATAATGTATy CCAGGTCTGT TTTTCAAAAT ATCTTGATTT CGTGTGTATG TTACTTCAAA 
TTGCGTTTTC TCATTTGACT TTTCATTAGA TAAATAAGTT AAAAATTCTG GATTAAAGCC 
ACTT.CTTACT AATGCTGGGT ATCTATATTT TGAAGCAAAG CTTAGTTCaG GGTTTTCTAC 
AGTAGCAATT CTCGTATTTC TATAGAATAA TAATTCATCA TTTCTATTTT TCACTTCTCC 
ACCATACTTC AAGTCATTCG CAATAACTGA CCAGTGTACA TGgCCAGTTn ATTTATTTTT 
ACCGCTGGCA ATTGTGTCAT AATTTGCTGC ATCATCAACT AATCGTTTTG GAAGTAGCTA 
TTTGCTG 

(2) INFORMATION FOR SEQ ID NO: 665: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 533 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 665: 
TTATCTGTCA TTAACCACTG GTACATGTGA ACCCGGCnTn AATCAATATA TATATTTAAA 
AGCAAAGGCG CGCCATGTGC CTTTcTTnTA CTTTGTATAT CTGTATCAAA ATCGATTTGA 
TTAAAATCCG CTTTATTTTA TCATCTATTC AAATGATTTT AGTGCGCTTA TTTTACTATG 
GCATTATTGC CTAACCTGTT TGAGATATAT TAATATTTGA TGATTCGTAT TCAAAGTTTT 
CATTTAACAT GTATTTAGTA TCATGATAGC TGCTTCATTG ATGATATACT ACCTACTTTT 
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CAGAGGCAAT ATTGAACAAT TCTTCATCAT GACTATTTTC CATCACATAA CTATGCTTAG 420 
CGAACGCTAA CATATCTTTA TCATTATTCG CATCTCCGAA GGCCATGAGC TCTGAAGGAG 480 

5 

ACATTTCCCA TTTATCTAAC AATCGTTTTA ATGCCTGnCC TTTAGTCATG TTT 533 
(2) INFORWATION FOR SEQ ID NO: 666: 

Q (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 400 base pairs 
<B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
<D) TOPOLOGY: linear 

•15 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 666: 
GACTTCTCTT GCACTAAAAA TTGCTCAAAT TGCTCGCTGT CATAACCAGG CGGTGTTTCC 60 

20 

AACCATACAT ATATGCCACC TTTAGCATGA ACAAATGGCA AATCAGCTTT TGCAAGCATG 120 
GCTTCGAATC GGTCACGACG TGTTTTAAAT ACATTGCTTT GTTCTTCTAA AAAATCATCA 180 
TAATGGATTC AAAGCATATA TTGCGGTCAT CTTGTAAATG CACCAAACAT CCCAGCATTT 240 

25 

GTGTGCGTTT GGTACTTTTT CAAAGCTTGA AATCATATCT TTATTACCAA CTGCCAAAAC 300 

CGACTCTGAA AACCTGGACA TGTTGATGAA CCTTTnAGAC AAGGGAAGAA ATTTGCAATC 360 

30 GCAACATCTT TGCCCATTTT nCCGAAGCAA GTGnGACTAG 400 

(2) INFORMATION FOR SEQ ID NO: 667: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 412 base pairs 
(8) TYPE: nucleic acid 
<C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



40 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 667: 



45 



SO 



TCTCCAATGC 


TACTCAAATT 


AAAAAGGTTT 


TAAATATTGT TAATTCTGAT 


CCAGAGCGAA 


60 


AGATTGTTAT 


CGTTTCTGCT 


CCAGGTAAAA 


GACATGATAA TGATATTAAA 


ACAACTGATT 


120 


TGTTAATCAG 


ATTATATGAA 


AAGGTCATTA 


ATCATCTTGA TTATCATGAT 


AAAAAAAGAG 


180 


AAATTATTCA 


GCGTTATGAT 


GATATTGTAA 


AAGAATTGCA AATGGATGAA 


AGTATTTTAC 


240 


GGACGATAGA 


TGTGACTTTG 


GAACATTATA 


TAAATCAATT AAAAAATGAA 


CCAAAGAGAC 


300 


TATTAGATGC 


ATTACTTTCT 


TGTGGTGAAG 


ATTTTAATGC GCaAyTGAtA GCyTTATATA 


360 


ATAAtAGTCa 


gGTtACCAAC AAmATwTATA 


TCCcCGAAGG AAGCGGGTAT 


TT 


412 



55 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 400 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 668: 

10 

TTACTCGTTA AAGATATTGT AAAAGATGAA GTGACAGAAT ATGACATTCA TCAAATGTTA 60 
CCGCATCCGA TTAATATGGT AAGGGTTAGA CTTTTTGGTG TGAAATTAAA AGAGATTATA 120 
75 GCTAAAAGTA ATAAACAAGA nTATATGTAT GAACATGCAC AAGGTTTGGG TTTCAGAGGG 180 
AATATATTTG GAGGATATAT TCTTTATAAT TTAGGGTACA TTCATTCTAC AGGGCGTTAC 240 
TATCTGAATG GAGAAGAAAT CGAGGACGAC AAGGAATATG TACTAGGTAC GATAGATATG 300 

20 

TATACGTTCG GTCnTATTnC CCAACATTGA AGGATTACCA AAGAGTATTT AATGCCAGAG 360 
TTTTTCAGAG GTATATTTAA nGAAAATTAT TGGCTATTTA 400 
(2) INFORMATION FOR SEQ ID NO: 669: 

25 

. (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1236 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 669: 



35 



45 



TGTTCGATAT 


TTTTAAATTT 


ATCTTTTAAA 


TACAACAACT 


GTTTCCGTAA 


TGATTTAACT 


60 


GTTTTATGAC 


TAATGCCATT 


GAATATTTCT 


AGCGTTTTAT 


TTAACTTATC 


GATAATCGCA 


120 


TGTAAATCCT 


TCAAAATGTC 


TTTTGTTTCA 


AAAGTAAATA 


CATTATGGAA 


GCGATGAATA 


180 


TCATCATCAT 


AAACATCAGA 


ATCATTGATA 


ATCGTAAATA 


TCGTTGAGAA 


CAATTGCTCA 


240 


TTTAACTCAT 


GAATCTCATT 


CATACTAGCC 


TTCAAGCCAA 


AAATATCAAT 


TGGTGCAATA 


300 


TCTAATTTTT 


CCAAAATTCG 


CTGCTTTTCC 


AGTTGATCAA 


TTGCCTTTAA 


CAATTTTTCA 


360 


TTTTCGTTTT 


TACCAATCAA 


ACCAAGCTGA 


TATTTAATAT 


CAGCATAACT 


CAACTCATTT 


420 


GTCACTTGAT 


TTAAGGCATA 


GTCTGGTAAG 


CGATGTGCTT 


CATCCACTAT 


ACAATCATCA 


430 


AACAATTGAT 


ATATTGAATT 


TTCAACATCA 


GAATGaATTA 


AATGTGCATG 


ATTTGTAATA 


540 


CCAATTTGaA 


TGTTCTGTGC 


ATTTCGCTTA 


ATAAAATTAT 


aATAATGAAC 


ATCGTGACGT 


600 


GCCGGTACAT 


ATGTTTCAAT 


TTTCTGGTCA 


AAATACATCT 


TTTGACCACC 


TTTTAAATTT 


660 
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ATATTCACtT CGTAATTACT TGTGTCATCT TTTAAAATTT GACTAATAAG CCCCAATGAA 
ATGTAATCaC TTtTACTTTT AATCAATAGT GCATTAATTT TAAAATTCAA CGCTTCATTC 
ATTGCTGGAA TATCmTTC TAACAATTGA CTTTGCAGTA ATTTAGTATT GGTAGAAATC 
ATGACATGCT TCCCAGTTTC AATATTATAC ATCAAGGCCG CAAGTAAATA TGCTAATGAT 
TTACCACTGC CTAGTGATGC TTCAATCATT GCTTTTTCAC TATGCATGAG CTGATCTAAT 
ATAGTTTCCG CTAAATATAA TTGTTGCGGT CGATATGTTA AGCCAAGTTG ATCTACAGCT 
TTGCTATATA AAGACTTCAA GCTGCCATTA TAATTTGTTG TCGGCTTTTT AAAATCAACT 
TGCTTACGAT AGATAATCTG TTCGAACTTT TCGTACGATT TATCCAATGG CTTTGCATCA 
TATTGCCTAA CCATCTCAAA GAAAATATCA TACAAA 
(2) INFORMATION FOR SEQ ID NO: 670: 
(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1819 base pairs 

(3} TYPE: nucleic acid 

(C) STRANDEDNE5S : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 670: 
ACASAATTAT TGACCAATAT GACTCGTGGA CTGATATGTT TAAAGCACTA CTGCATGAAA 
CATTTAAAGC ATATGGCGTT CTATTTATAG ATGCGCAGTT TGAGCCGTTA AGAAAAATGG 
AAGCGCCTAT GTTTAAAAAG ATTTTGAAAA AACATCAGTT GCTTGATGAT GCTTTTAGAG 
CAACACAACA ACGTACTCAA AATCAAGGCT TGAATGCGAT GATACAAACA GATACAAATG 
rrCATTTATT CTTACATGAT GAAAATATGC GTCAATTAGT tTCGTATGAT GGTAAGCAyT 
TTAmATTAAA TAAAACAGAT AAGACATATA TAAAGGAAGA AATTATAAAT ATTGCGGAAA 
ATCAACCkGA ATTATTTTCT aATAATGTAG TGACAAGACC ATTAATGGnA GAATGGTTAT 
TTGAACACGG TGGCATTTGT TGGAGGACCG AGTGAAATTA AGTaCTGGGC TGAACTAAAA 
GATGTATTTG AACTATTTGA TGTTGAAATG CCtATCGTGA TGCCAAGGCT TAGAATTACT 
TATTTAAATG ACCGTATAGA AAAATTACTT TCGAAATACA ATATTCCATT AGAAAAAGTG 
TTAGTCGATG GTGTTGAAGG AGAAAGAAGT AAGTTTATTA GAGAACAAGC ATCACATCAA 
TTTATTGAAA AGGTAGAAGG TATGATTGAA CAACAGCGTC GTCTAAACAA AGACTTATTA 
GATGAAGTGG CGGGGAATCA AAATAATATT AACCTTGTGA ATAAAAATAA TGAAATTCAT 
ATACAACAGT ATGATTATTT GTTAAAACGT TATCTTTTAA ACATTGAAAG AGrAAACGAC 
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10 



GAAAGAATAT GGAATCCACT TCAAATTTTG AATGATTTTG GGACAGATGT GTTCAAGCCC 960 

TCCACCTATC CACCACTTTC TTACACTTTT GATCATATTA TTATAAAACC TTAATATACC 1020 

AAGGGTTTAG CCCGATTTAT CTTAATGATA AATCGGGCAT TTTTTTGTTT TTTAAAATAA 1080 

ATTTCACAAA TTTTGTATAA ATAGTGGTGG ATAGTGGGGA GATGTGGTAA ATTATATATA 1140 

AGGTGAGGTG ATAAAAAATG TTCATGGGAG aATACGATCA TCAATTAGAT ACAAAAGGAC 1200 

GTATGATTAT ACCGTCCAAG TTTCGTTATG ACTTAAATGA GCGTTTTATT ATCACAAGAG 1260 

GCCTTGATAA ATGTTTATTC GGTTACACTC TAGACGAATG GCAACAGATT GAAGAGAAAA 1320 

TGAAAACCTT ACCTATGACA AAAAAAGACG CACGTAAGTT TATGCGTATG TTCTTCTCTG 1380 

GTGCTGTTGA AGTAGAACTT GATAAGCAAG GGCGTATTAA CATCCCTCAA AACTTGAGGA 1440 

AATACGCTAA TTTAACTAAA GAATGTACAG TAATCGGTGT TTCAAATCGT ATTGAGATTT 1500 

GGGATAGAGA AACTTGGAAT GATTTCTATG AAGAATCTGA AGAAAGTTTC GAAGATATTG 1560 

CTGAAGATTT AATAGATTTT GATTTTTAAA ATGGAGGAAT TGAAGtGTTT CATCATATCA 1620 

GCGTTATGTT AAACGAAACC ATTGATTATT TAAATGTAAA AGAAAATGGT GTGTACATTG 1680 

ACTGTACGCT AGGTGGAGCG GGACAnGCCC TTTATTTACT AAATCAATTA AATGACGACG 1740 

GAAGATTAAT AGCAATCGAT CAAGACCAAA CTGCAATTGA TAATGCTAAA nGGGTATTAA 13 OO 

30 AGGATCATTT GCATAAAnG 1819 
(2) INFORMATION FOR SEQ ID NO: 671: 



20 



25 



35 



40 



SO 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 609 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNBSS : double 

(D) TOPOLOGY: linear 



Cxi) SEQUENCE DESCRIPTION: SEQ ID NO: 671: 

ACCAATTATT GGACAGGAAT TAGCAAAAAA TGCAATGCTT GCATTAATCT ATGCATCGAT 60 

45 AGGTATCATC ATCTATGTAT CATTACGATT TGAATGGCGC ATGGGTCTTT CATCTGTATT 120 

GGCATTATTA CATGATGTAT TCATTATAGT AGCGATTTTC AGTTTATTTA GAATTGAAGT 180 

AGATTTAACA TTTATCGCCG CTGTATTAAC AATTGTCGGT TATTCAATTA ATGATACAAT 240 

CGTAACGTTT GACCGTGTAC GTGAAAACTT ACAAAAGGTT AAAGTGATTA CGACAACAGA 300 

ACAAATTGAT GATATCGTTA ATAGATCAAT tAGACAGACA ATGACACGTT CAATTAATAC 360 

AGTATTAACA GTTATTGTAG TAGTAGTTGC TATACTATTC TTCGGTGCTC CTACGATATT 420 

55 
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TX3CCGTTCCG CTATGGGGAA TAATGAAAAA ACGTCAGTTG AAAAAATCGC 



CGAAACACAA 



540 



ATTAGTTGTA TATAAAgAAA AGAAATCGAA CGATGAAAAG ATTTTAGTTT 



AAAAtGaATT 



600 



AAGCGGTAT 



609 



10 



15 



20 



25 



30 



35 



40 



45 



SO 



(2) INFORMATION FOR SEQ ID NO: 672: 
(i) SEQtTENCE CHARACTERISTICS: 

(A) LENGTH: 2222 base pairs 
(a) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 672: 

CTTAAAACAG CAATTTGAAC GTTTACAAAA TGAACAAATC TTTGTTTATG TTTGTCATGG 60 

TAATCACGAT CCTTTATCAT CAAAGATTTC ATCAAACTGG CCAGATAATG TtnTTGTATT 12 0 

TTCAAATAAA GTTGAGACGT ATGAAGCAAT TACTAAATCT GGTGAAACAA TTTATATTCA 180 

CGGATTTAGT TATGAAAATA GAGCAAGTTA TGAGAACAAG ATTGATGAAT ATCCATCAAG 240 

TCAAGGCCAA AAAGGCATAC ATATTGGTGT CTTGCATGGT ACGTATAGTA AATCTTCAGT 300 

TAACGAAAGA TATACCGAGT TCATTTTAGA AGATTTAAAC AGTAAATTGT ATCATTATTG 360 

GGCTTTAGGT CATATACATG AACGTCAACA ATTAAGTGAT ATGCCTGTAA TTAACTATTC 420 

AGGTAATATT CAAGGTAGAC ATTTTAATGA GCAaGGTGAA aAAGGTTGCT TATTAATCGm 480 

GGGTGACCAC TTAAAATTAA AGACTAAATT TTATCCTACA CAGTATATTA GATTTGAAGA 540 

AGCAACTATT GAAACGGATA AGACATCTAA GCAAGGTTTA TACGAGGTCA TTCAAAACTT 600 

TAAAGAACAA GTGAGAGAAG AAGGAAAAGC CTTTTATCGT TTAACGCTTG TTATTAATAG 660 

TGAGACATTA ATTTCACCTC AAGATTTATT ACAAGTTGAA GAAATGATTA CAGATTAXGA 720 

AGAAAACGAA AATCAATTTG TATATATTGA TGAGTTAAAA ATACAATATG CACAAAATGA 780 

TGAGTCACCT TTAGTTAATG AATTTTCAGC GGAATTATTA GTCGATCAAA CTGTTTTTGA 84 0 

TAAAGCGATG TCAGATTTAT ATTTAAATCC AAGGGCATCT AAGTTCCTAG ACGATTATGG 900 

AACATTCGAC CATACAGCAT TAGTTAATCG TGCTGAAGAA ATATTAAAAG CTGAAATGAG 960 

AGGTGAACAA AATGATAATT AAATCACTTG AAATTTATGG TTACGGTCAA TTTGTTCAaC 1020 

GTAAAATTGa ATTTAATAAA AACyTCaCTG AAATTTTTGG TGAAAATGAA GCGGGTAAAT 1080 

CGACGATTCA AGCATtCATC CATTCGATAT TATTTGGATT TCCAACTAAA AAGTCTAAAG 1140 

AGCCAAGACT AGAACCACGT CTAGGTAACC AATACGGTGG TAAATTAGTA CTTATTCTTG 1200 
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TATATTTACC TAATGGTGCT GTGCGTGATG ATGCTTGGTT ACAAAAGAAA CTTAATTATA 
TTTCTAAAAA GACATATCAA GGTATCTTTT CATTTGATGT ACTAGGGCTT CAAGACATTC 
ATAGAAATCT AAATGAAAAA CAATTGCAAG ATTATTTATT ACAAGCmGGG GCTTTAGGAT 
CAACTGAaTT CACGTCAATG CGCGAAGTGA TTAATCGTAA AAaAGATGAA TTATATAAAA 
aATCAGGTAA AAATCCGATC ATTAATCAAC AAATTGAGCA ATTAAAACAA CTAGAAAGTC 
AAATTCGTGA AGAAGAAGCA AAGCTAGAAA CATATCATCG CTTAGTAGAT GATCGAGATA 
AATCATCACG TCGATTAGAG AATTTAAAGC ATAATTTAAA TCAATTATCA AAAATGCATG 
AAGAAAAACA AAAAGAGGTT GCTTTACATG ATCATTCACA AGAATGGAAG TCTCTAGAAC 
AACAGTTAAA TATTGAGCCA ATCACATTCC CAGAAAAAGG TGTGGATCGT TACGAAAAAG 
CACGAGCGCA TAAGCAATCG TTAGwAAGAG ATATTGGTTT AAGAAATGAG CGTTTAGCTC 
AACTTAAAGA AGAAGCGACT CAATTAGAGC CAGTTAAACA ATCTGATATT GACGCCTTCA 
TTAGTTTGAA TCAACAAGAA AATGAAATTA AAAATAAAGA ATTTGAACTT ACTGCAATCG 
AAAAGGATAT TGCGAATAAA CAACGTGATA AAGATGAATT GCAATCAAAT ATTGGTTGGT 
CTGAAACGCA TCATGACGTA GATAGTTCAG AGGCAATGAA AAGTTATGTC AGTGAGCAAA 
TCAAGAATAA ACAAGAACAA GCTGCATACA TTAAACAATT AGAACGTAGT TTAGAAGAAA 
ATAAAATCGA AGATAATGCG GTTCATAGCG AACTAGATTC TGTTGAAGAA AAATAGTTCC 
TG 

(2) INFORMATION FOR SEQ ID NO: 673: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 406 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 673: 
TTGCAGGTAT CATTTTTTTA ATGCCATATG GATTATGTTT TCTACCGTTT TATAAGCAAA 
AAAAGAAAAA ACAGACATTT AAAAAATACA TGGTTTACAC TACGATTGGT TTGTCAATTT 
GTCTAGGCTT ATCTCTAGTT TTGGTTCACA CTACGAAAAT TTATATGGAC GAAGGTGGCG 
TAAGATACTA TTACGGTAGT TTTGTAATGA AACAAGCGGG CGGTTATGCT TATTTAGCTT 
TAGCGGTACT TTCAACGTTG TTAATTGTTG CGAAAAAAGC TACAAATAAA AATAAAGAAA 
TCGAAACCGT CGACAATACA AATATAACGG AAAGATAATT AAGGGAGTGC TCATTCAGGA 
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(2} INFORMATION FOR SEQ ID NO: 674: 

(i) SEQUENCE CHARACTERISTICS: 
5 (A) LENGTH: 927 base pairs 

(B) TYPE; nucleic acid 

(C) STRANDEDNBSS : double 

(D) TOPOLOGY: linear 

10 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 674: 

CCACTTTGTG GATTTTCTTT ATATTCTCCA CGCTTGtACT ACAACTTCTT TCGTITCTGT 60 

75 TTCATCACCG ACTGCCGCAT TOGTTAGCAC ATGTAATAAC TCTTTTGCGG TTAATACATT 120 

CTCATCTATA ATCTTATCTT TTTGTTCTTG TATATATTGC TTGATGTGCG GCTTTTTCAA 180 

TAACCTACAC GCTGTCACAT GTGCGCTATT TGCGTTATAT CCTGyTTTTA TGGCACTTTG 240 

20 TGTTACATTC AGTGTTCTAA TATACTCATT CACAAAACGT GCTTGCITTG CAGTTAACTC 300 

ACTCATTTTA TCACCCCCAC AATTTTATCT AATATGGTTT CATACCATAA TATTACAGAT 360 

TGTTCTGAAC AATCTAAGGC ACTACTAATA TCTTGATAAC TAAGTCCTTG TATAAGGGAG 420 

TCAAAAATAT AAAACTCTTT ATCGGTCGCT AATCTGTCAA CAATCATTTC TATGTGATTC 430 

TTTATAATAT GATCATTGAC ATTATCGTCT GTCATCAATT CGTCAGAATC TTCATCACCT 540 

ATTAAAAAGA AATCATCAGT ATTTATTTCA TCATCGCCCC GTTAACTAGC TTTGAAGTCT 600 

TTAGCACACT TGCATATACC GGCTGTCGTG CTGGCkAGAT ACTAGCATTG AAGTGGTCTG 660 

ATATTGATTT TGAAAACAAC ACGATTAGTA TTACTAAAAC ATATTACAAT CCAAATAATA 720 

35 ACAAGAAGAA ATATCAGATA CTTCCCCCTA AAACTGAAAG TTCTATCGGT AAGATTTCCG 780 

TTGACCCAAA TGTAATAAAG GtGtTGCGtG ATTATAAGAT AAACGTTCAA AATAATTGGA 840 

AAAACGAATT ATATAATGAT AACCATTGTA ATGAAAAAAC TATCAATGTG GATACAAACC 900 

ATTATGTCAC GTACCAGCAT ACTCAAA 927 
(2) INFORMATION FOR SEQ ID NO: 675: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH; 1100 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



25 



30 



40 



SO 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 675: 
GATGTTAAnA TAAGTACATC ATTTTGACTC CCAAATATTG GCTTTAGACC TTGAAATGCT 60 



55 
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CTCATAATGG CATCAGGTAC cAGGGGTTGG GaCCAGGTGT TAATAACAAC GGTTGATGAT 180 

AATACATTTA TATGCCTCCT ATAAATAAGA TTTCACTATT TTAGCAAATT TTCTGAAAAT 240 

^ TTAAAAGCCT AAAAAgtGAT AACGCTATAT TGTCGAACAA ACGTTATCAC TTAACGATTT 300 

TATTTGGCCT GAATGATGGG ATAGATTTTT ATGTCCACAT TATTTCTTAC AGCATTTGAA 360 

ATCATGCAAT TATTATCTGC AATTGTTATC AATTTTGGTA ATCGCTTTTC TAATTGTGCT 420 

10 

ATTTGATCAC TTGGAATTTG AATTTGAGGA TGGTGCACAA TTTTTGACAT ACTGAATTTT 480 

CCGTTATTTA AACAAGCTGT TCCAATCGAT TGTTGTkCAA TTGAAATATC TGTGAACTTT 540 

75 GCACGTTCAA GAGTAGCTGC TAATGAGATG ATATAACATG ATGAAGCGGC TGATACTAAC 600 

ATTTCATCGG GATTTGTTCC TATACCAACA CCACCTAAAG AAGCAGGTAT AGAAATATTC 660 

TCTGAAAGTA TGTCGCCTTG AACGTTTCCG ACATTGTTAC GACCACCTTG CCAAGAAGTT 720 

2^ TGGACTTTAA AGTCATGTTG ATGCAATTGC TTTAACCTCC AATATAATTG TGATAGTTTA 780 

ATTTTAGAAT AGTTTATCAA AGTTTAACAG AAAGGTGACT TATCAATGAC TCTGAATAAA 840 

CTGAAAGATG AATTACAAAT TGTTTCGCAC CGTGGATTGC CGAGTGATTT TCCTGAAAAT 900 

2S 

ACAATGGTCG GTTATCGAGA GGTAATGGGG CTCAATGTTG CTATGTTAGA AATAGATGTT 960 

CATTTGACCA AAGACCAACA TTTTGTTGTG ATACATGaTG AAACAATTGa TAGAACATCG 1020 

GaTGGtArGG GGCGTAwTGc TGaTTACACA TTATCGCAAT TAAAATCATT TGATTTTGGT 1080 

30 

AGTTATAAAG ATGTTGCTTT 1100 
(2) INFORMATION FOR SSQ ID NO: 676: 

35 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 460 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDBDNESS : double 

(D) TOPOLOGY: linear 

40 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 676: 

ATTAATTTCA TATGGAAATA GTTGAACTAA CTGCGCTGTA TAAGCTTCAA CAGTTTGATG 60 

4S 

AATTAACGAT TGATCTTCAA TATATCCGTA GAACAAATCT TCAGTACAAA CTACTTTACC 120 

TTTATCAGGT TTAATTGCAC CTGCCAACAA TTGACCTACC AACGCTTTGG AAGATTCAGG 180 

TTCACCAATT ATACCTAATG CTTCTCCTTG ATAAATATGT AAACTAATAT TGTTTAAATC 240 

SO 

GATATCTTCA GCATCATATC CAAAAGGTAA ATACCATTTC TTATTCTGTT TATTCCTATA 300 

GTAGTGTGTT ACTTTTAGTA ACTTTAAAAC AATTGAACTT CCCATCTATT TTCATCCTTC 360 

55 
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CCCCACGCaA AAATACCTTT TAATCTTnCT ACTTTAAAAT 
(2) INFORMATION FOR SEQ ID NO: 677: 

5 

(i) SEQUENCS CHARACTERISTICS: 

(A) LENGTH: 1451 base pairs 

(B) TYPE: nucleic acid 

(C) STRAJJDEDNESS : double 

(D) TOPOLOGY: linear 

10 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 677: 



75 


GTCAAGTTTT CGGCTAGATT TTAAACGCTC ATCACTATGT AGAATGAAAC 

■ 




60 




CTGTAAATCA TCATAACCTT 


TTACATAAAC 


ATAACCTTCG 


CCACCAATTG 




120 




ACATTGGGCG GCCATTTGAA 


TTTCTAAAGA 


TTGTTTTTCT 


AGCCTATTAA 




IBO 


20 


TAGTTGTGTG TTTAAGATTT 


TTGACATCTT 


TATCCTCCAA 


TCTACTTATA 


AAAlAl l\.7i.A 






ATTAATGACT ACATATTATG 


CAACGGCTTA AATTGTATAA AAATGTATAC 


Vjr 1 1 1 V7V,^ 1 I X 




2S 


AGTATAACTA TCGCATTTTT 


CAAAAAATAC 


ACATTTAATC 


TGCAGTATTT 




J o u 


ACGCTATTTT TTTGATATAA 


TTACTTTGAA 


AAATACGTGC 


GTAAGCACTC 








TTTCATGCCT TTAGTTTCAA TGAAAGAAAT 


GTTAATTGAT 


GCAAAAGAAA 


ATGGTTATGC 


^ O w 


30 


GGTAGGTCAA TACAATATTA 


ATAACCTAGA 


ATTCACTCAA 


GCAATTTTAG 


AAGCGTCACA 






AGAAGAAAAT GCACCTGTAA 


TTXTAGGTGT 


TTCTGAAGGT 


GCTGCTCGTT 


ACATCAGCGG 


600 

W V V 




TTTCTACACA ATTGTTAAAA 


TGGTTGAAGG 


GTTAATGCAT 


GACTTAAACA 


TCACTATTCC 


660 


35 


TGTAGCAATC CATTTAGACC ATGGTTCAAG 


CTTTGAAAAA 


TGTAAAGAAG 


CTATCGATGC 


720 




TGGTTTCACA TCAGTAATGA 


TCGATGCTTC 


ACACAGCCCA 


rrCGAAGAAA 


ACGTAGCAAC 


780 




AACTAAAAAA GTTGTTGAAT ACGCTCATGA AAAAGGTGTT 


TCTGTAGAAG 


CTGAATTAGG 


840 


40 


TACTGTTGGT GGACaAGAAG 


ATGATGTTGT 


AGCAGACGGC 


ATCATTTATG 


CTGATCCTAA 


900 




AGAATGTCAA GAACTAGTTG 


AAAAAACTGG 


TATTGaTGCA 


TTAGCGCCAc 


ATtAGGTTCA 


960 


45 


GTTCATGGTC CATACAAAGG 


TGAACCAAAA 


TTAGGATTTA AAGAAATGGA 


AGAAATCGGT 


1020 


TTATCTACAG GTTTACCATT 


AGTATTACAC 


GGTGGTACTG 


GTATCCCGAC 


TAAAGATATC 


1080 




CAAAAAGCAA TTCCATTTGG 


TACAGCTAAA 


ATTAACGTAA 


ACACTGAAAA 


CCAAATCGCT 


1140 


SO 


TCAgCAAAAG CAGT7CGTGA 


CGTTTTAAAT 


AACGACAAAG 


AAGTTTACGA 


TCCTCGTAAA 


1200 




TACiTAGGAC CTGCACGTGa 


AGCCATCAAA 


GAAACmGTTA 


AAGGCAAAAT 


TAAAGAGTTC 


1260 




GGTACTTCTA ACCGCGCTAA 


ATAATTAATA 


ITTAGTCTTT 


AAGTTATTAA 


TAACGTAGGG 


1320 
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AATAAATAAA ACAGTTTGAT TTTAAAATGA AAGCGTAAAA ATGGTAAAAT ATATCAAAAT 1440 

TGATTGTGAT A 1451 

* (2) INFORMATION FOR S£Q ID NO: 678: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 66B base pairs 
(3) TYPE: nucleic acid 
10 (C) STRANDEDNSSS : doilble 

(D) TOPOLOGY: linear 



75 



25 



30 



Ui) SEQUENCE DESCRIPTION: SEQ ID NO: 678: 

nGTATTGAAG CGGTTAAACA AACACCTAAT GCAACTGACG AAGAAAAGCA GGCTGCTGTT 60 

AATCAAATCA ATCAACTTAA AGATCAAGCA ATTAATCAAA TTAATCAAAA CCAAACAAAT 120 

20 GATCAGGTAG ACACAACTAC AAATCAAGCG GTAAATGCTA TAGATAATGT TGAAGCTGAA 180 

GTAGTAATTA AAACAAAGGC AATTGCAGAT ATTGAAAAAG CTGTTAAAGA AAAGCAACAG 240 

CAAATTGATA ATAGTCTTGA TTCAACAGAT AATGAGAAAG AAGTTGCTTC ACAAGCATTA 300 

GCTAAAGAAA AAGAAAAAGC ACTTGCAGCT ATTGACCAAG CTCAAACGAA TAGTCAGGTG 360 

AATCAAGCAG CAACAAATGG TGTATCAGCG ATTAAAATTA TTCAACCTGA AACAAAAGTT 420 

AAACCAGCTG CACGTGAAAA AATcAATCAA AAAGCGAATG AATTACGTGc TAAGATTAAT 480 

CAGGATAAAG AAGCAACAGC AGAAGAAAGA CAAGTAGCAC TAGATAAAAT CAATGAATTT 54 0 

GTAAATCAAG CCATGACAGA TATTACGAAT AATAGAACAA ATCAACAAGT TGATGATACA 600 

ACAgTCAgCG CTgATAGCtT GCTTTAGTGA CGCCTGACCA TATTGTTAGA GCgCTGCTAG 660 

AGATGCGT 663 
(2) INFORMATION FOR SEQ ID NO: 679: 

40 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1906 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

45 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 679: 
GATCCAAATT TAAAAGGAAA AATAGCCTTi' AACGAATTT'A CGAAACAAAT TGAATGTTTA 60 

SO 

GGGAAAGTGC CATGGAATAC TAATTTTAAG ACACGTCAAT GGCAAGACGG TGATGATAGC 120 
AGTTTAAGAA GTTATATCGA AAAGATTTAT GACATACACC ATTCAGGTAA AACAAAAGAT 180 

55 
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ATCGTGGGAT 


GGACATAAAC 


GCCTTGAAAA 


GTTATTTATC AAATACTTAG 


GTGTTGAAGA 


300 




CcTGaAGTGA ATAGAACAAC 


TACCAAAAAA 


GCATTGACTG 


CTGGAATCGC 


TAGAGTAATG 


360 


5 


GAGCCTGGAT 


GTAAATTTGA 


CTATATGCTT 


ACAClTrATG 


GTCCTCAAGG 


TGTAGGTAAA 


420 




TCTGCTTTGC 


TAAAAAAATT 


AGGTGGTGCA 


TGGTTTTCTG 


ACAGTTTAGT 


TTCTGTTACA 


480 




GGTAAAGAAG 


CTTATGAGGC 


CTTACAAGGC 


GTTTGGCTAA 


TGGAAATGGC 


AGAACTTGCA 


540 


10 


GCTACAAGAA 


AAGCTGAAGT 


TGAAGCTATT 


AAGCATTTCA 


TATCTAAACA 


AGTTGACCGA 


600 




TTTCGTGTTG 


CTTATGGGCA 


TTATATTGAA 


GATTTTCCAA 


GGCAATGTAT 


TTTCATTGGT 


660 




ACAACTAATA 


AAGTTGATTT 


CTTAAGAGAT 


GAAACTGGTG 


GAAGACGTTT 


TTGGCCAATG 


720 


ACTGTAAATC 


CAGAGAGAGT 


TGAAGTGAAC 


TGGTCTAAAC 


TAACCAAAGA 


TGAGATTGAC 


780 




CAAATTTGGG 


CAGAAGCTAA 


ACACTATTAT 


GAACAAGGAG 


AAGATTTATT 


CCTTAACCCT 


840 


20 


GAACTAGAAG 


AAGAAATGCG 


TTCAATACAA 


AGCAAACATA 


CTGAGGAATC 


TCCATATACA 


900 




GGCATTATTG 


ATGAATATCT 


TAACACACCm 


ATTCCtAGCa 


ATTGGGATGA 


CTTAACTATC 


960 




TTTGAACGAA 


GACGATTTTA 


TCaAGGTGAT 


GTTGATATGT 


TACCaACAGG 


AAATGTaGAT 


1020 


25 


TACGTTAAAA 


GAAATAAAGT 


CTGTGCGCTT 


GAAGTGTTTG 


TTGAATGTTT 


TGGTAAAGAT 


1080 




AAGGGAGATA 


GTAGAGaz^TC 


TATGGAAATT 


AGAAAGATTT 


CAAACATCTT 


AAGACAATTA 


1140 




GACAATTGGT 


CTGTATATGA 


TGGTAATAAA 


AGTGGGAAAA 


TTCGATTTGG 


AAAAGATTAT 


1200 


30 


GGTGTACAGA 


TAGCTTATGT 


AAGAGATGAA 


AGTTTAGAGG 


AriTAATATA 


AGAAATATTG 


1260 




AATAAATATG 


CATTTTAGAG 


TGTTGTATCA 


GATGTTGCAT 


CATTTTTTGA 


GTGATGCAAC 


1320 


3o 


ACGGGAGTGT 


AAAAAGTAAT 


CGTAGGTGTT 


GTATCATTTT 


TGGTGATGCA 


ACATTGATGC 


1380 


AACAAATGAT ACAACACCTC 


TTTCCTTTCT 


AGCTGTAGGG 


TTCAACCCTG 


TTTGTTTCCA 


1440 




ATGTTGCATC 


AAATTCACTA 


TAAAGTTTAA 


AAAGTAGTGT 


TAGGGAGTAA 


AGGGGTATAG 


1500 


40 


GGGTAACCCT 


CTAACAGCTA 


TTTTTAAAAG 


TTTGGCAAGA 


ATTGATACAA 


CATCGGAACA 


1560 




CAAATATAAA 


TTTTGTATAC 


AAGGTGAATA 


AATGAAAGAA 


TCGACATTAG 


AAAAATATTT 


1620 




AGTGAAAGAG 


ATAACAAAGC 


TAAACGGTTT 


ATGTTTAAAA 


TGGGTCGCAC 


CTGGAACAAG 


1680 


45 


AGGTGTGCCA 


GATAGAATTA 


TTATTATGCC 


AGAAGGAAAA 


ACATATTTTG 


TAGAAATGAA 


1740 




GCAAGAAAAA 


GGAAAGTTGC 


ATCCTTTACA 


ArAATATGTG 


CATAGACAAT 


TTGAAAATAG 


1800 




AGaTCATAAA 


GTATATGTGT 


TATGGAATAA. 


AGAACAAGTA 


AATACI-rrTA 


TCAGAwTGGT 


1860 


SO 


AGTCAACATT 


TGGCGATTGA 


CTTTCAAACC 


ACATAGCTnT 


CCAAAG 




1906 




(2) INFORMATION FOR SEQ ID NO: 680: 
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(A) LENGTH: 948 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 680: 
AATTATTTGA ATAAATTAGC AATTAAAGAG TTGATTTGTC AGTTTAAGyA TTTGAGTGCA 
TTTGAAAAAG ATGTCATGTA TTTAATGTGT GAACAATATA AGCCGAGAGA AATTGCTCAA 
TTGATGCATG TAAAAGAGAA AGTGATTTAT AATGCCATAC AACGATGTrA AAATAAAATA 
AAACGTTATT TCAAAATGAT TTGAAAAGCG CCTTAGGACG TGAATTGAAT TATAACGTGT 
TACTTACTGA TGGTTTGACA TTTGTTATAA ATTTTATGTA TAGTATACTG GTATTATAAT 
GAATAAAGGT GAATTATTGT GAGAAAAATA CCTTTAAATT GTGAAGCTTG TGGCAATAGA 
AATTATAATG TTCCTAAGCA AGAAGGCTCG GCAACAAGAT TAACCTTAAA GAAATATTGT 
CCAAAATGTA ACGCGCACAC AATTCATAAA GAATCGAAAT AAATACATTC GAAATAATAC 
TTTGATAATA TGTTCAAAGG ATTTGGAGGT TGAGCAGATG GCTAAAAAAG AAAGTTTCTT 
TAAAjGGCGTT AAGTCTGAAA TGGAAAAAAC AAGTTGGCCG ACGAAAGAAG AGCTATTTAA 
ATATACTGTA ATTGTAGTTT CTACTGTTAT ATTCTTCTTA GTCTTTTTCT ATGCCTTAGA 
TTTAGGAATT ACAGCATTGA AAAATTTATT ATTrGGTTAG AGGAGTGAAG ACATGTCTGA 
AGAAGTTGGC GCAAAGCtTG GTATGCAGTG CATACATATT CTGGATATGA AAATAAAGTT 
AAAAAGAATT TAGAAAAAAG AGTAGAATCT ATGaATATGA CTGAACAAAT CTTTAGAGTA 
GTCATACCGG AAGGAAGAAG GAAACCTCCA GTAAnAAGnT GGCCAAGCCT AAAACCGCCT 
GTTAAAAAAA ACCATTCCCC TGGGnTAnGG TTTTAAGTGG GAATTTAA 
(2) INFORMATION FOR SEQ ID NO: 681: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 863 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 681: 
ACAnATAATA ACAAAGCGCT TCCTAGTACC TCTTAAAAAG ATGATGCTAG CAAGCGCTTk 
TCTATACTAT ATATTATTTT TCTAAAATTT TAACACCCTC TTGAGTGCCT ACAATAACTT 
GATCTGCCAT ATCTAAGAAG TATCCTGTCT CAAACACACC TGTCAGATGA ATTAAATACT 
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TATCAGTTAT AAATGCGACA TCTTCGTTTA CACGACGTTC TACTTTTATA TCAGCGTATG 

ATTCAATTTT ACGTAATATG TGATACCAGT TAAATTTATC CACCTCTACT GGTAACTTAA 

ACGTCTCACC TAAGTATTGA ACTATTTTCG TTTCATCGAC AACCACAACA AAACGCGATG 

CCATTTCATC TATAACTTTC TCTCTGAACA GCGCACCACC GCCACCTTTA ATTATATTTA 

AAGATGGATC TACTTCATCA GCACCATCAA TTGCTAAGTC GATATGATCA ACATCATTGA 

TTTCACATAT TTTAATACCT AATTCTTTTG CTAAAAATGC AATTTTATTA GAAGTGCATA 

CACCTGTAAT ATTGTAACCA CGTTCTTTAA TTAGTTGCGC CATTTGAGGT AAGAGTAATT 

CCATTGTACT TCCTGTACCA ATTCCCAGCG TCATGTCACC ATTGATTkGA CTTAAAACAT 

CATTTAATGT CATTAACTTG AGTGCTTTGA CATCTTTCAT GAAGGTAGCC TCCCATATTT 

AtGTAATCTA TTCAATTCAT ATTTTACATG ACTCGTATAA ATTAACATAC CCTTATnGCT 

AACCATTTGT GTTAAACATA TCG 

(2) INFORMATION FOR SEQ ID NO: 6B2: 

(i) SEQUSNCE CHARACTERISTICS: - • 

(A} LENGTH: 4 80 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 682: 
TTCATTTTTG TTGTTCAGCA ATTTTGGTCC GAATTTCAAT TCATCAGATG ATAGCTCTAT 
TAATTCTGTA GAATATTCTG CtACAACAAT TTCATAAATA TGGCCTTTTT CTTCCATTAT 
TATTTCATCa ATTATTTCAT AATTCAATTG TTGTAATGTT TGTCTTAAAT TTTCAGTTTG 
GATATTACTT TGTAAAATCA ACCTTGGATG TTGACTTAAC TTATCTTGCC CATCTTTTAA 
AATTTTAGCA ATAAGTGGTC CGCCCATACC ACAAATTGTG aTATTATCGA TTACGTCCTC 
AGGTTGAATA ACACTTAAGC CATCCCCTAA ACGTACATCA ATTCTATCTA CTAATTGGTT 
TGCAGCTACA TTTTTCACAG CAGCTTGAAA AGGGCCTTGA ATAACTTCTC CAGCAATACC 
GaTTCGCATA AATGGTTTTG AATTGCATAG ATTGGCAAAT AAGCATGATC TGAGCCAATA 
(2) INFORMATION FOR SEQ ID NO: 683: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 689 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 683: 
CTGCAAAAAA TATTGGTATA ATAAGAGGGA ACAGTGTGAA CAAGTTAATA ACTTGTGGAT 
AACTGGAAAG TTGATAACAA TTTGGAGGAC CAAACGACAT GAAAATCACC ATTTTAGCTG 
TAGGGAAACT AAAAGAGAAA TATTGGAAGC AAGCCATAGC AGAATATGAA AAACGTTTAG 
GCCCATACAC CAAGATAGAC ATCATAGAAG TTCCAGACGA AAAAGCACCA GAAAATATGA 
GTGACAAAGA AATTGAGCAA GTAAAAGAaA AAGAAGGCCA ACGAATACTA GCCAAAATCa 
AACCACAATC CACAGTCATT ACATTAGAAA TACAAGGAAA GATGCTATCT TCCGAAGrTT 
gGcCCAAGAA TTGAACCAAC GCATGACCCA AGGGCAAAGC GACTTTGTTT TCGTCATTGG 
CGGATCAAAC GGCCTGCACA AGGACgTCTT ACAACGCaTA AcTACGCACT ATCATTCAGC 
AAAATGACAT TCCCACATCA AATGATGCGG GTTGTGTTAA TTGAACAAGT GTACAGAGCA 
TTTAAGATTA TGCGAGGAGA GGCGTATCAT AAGTAAAACT AAAAAATTCT GTATGAGGAG 
ATAATAATTT GGaGGGTGTT AAATGGkGGa CaTTAAATCC mCGTTCATTC mATATATAAG 
ATATATCACG GTAATTGCGC ATATAACTT 
(2) INFORMATION FOR SEQ ID NO: 684: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 85B base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : doxible 

(D) TOPOLOGY: linear 

{xi) SEQUENCE DESCRIPTION: SSQ ID NO: 684: 
TTATTAAATT GGTATGTGTT CATTATACAT ATGaCAAATA TGaATGTAAA CCGATAATTT 
AGATTTTTTG GAATAACCTG AAAATTCAAG TTaTAGCGTT GCTTATATTT TAAAAGGTGG 
TGATAATGAG ACTTTTTGAA AAATAAAATT CAAAATACTT ATAGCATAAT CAATATGCAC 
ATTAAATAAA TGTACTCTTT TAATGCGTTG ATAACTGTAT TTGTT^TTTA GAGAAGGGGT 
GTTCACTATG CTGATGTGTT AAAAAATAAA ATAAAAAGGA CACCTCGATG CTATAAATAT 
TAGCATCGAG ACGCCCAGTT AATGTCTATT AAATTGAATA TAGTCTCGGA CATGAATCAA 
TGCCCTAGGC CCTGCAATGT TATATTGACA GTAGTTGACT GAATGAAAAT GACTTTGTAG 
CTAGCTTTTT TCAATCCTTG TCGGTGCAAC ACATAGAGAA ATTGGATTCC TAATTTCTAC 
AAACAATACA AGTTGCGGAA TAAGTCCCAA TATAGAAGGT GACAGTAAGC CAACTTACAA 
TAATGTGCAA GTTGGTCGGG CCTCAATACA GAGATTTTCG AAAAGAAATT CTACATATTA 
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GCCACCTTGT TTATTTAAAT XGATAACACG GTTTGCGATT GTATTGATAA ATTCAAAGTC 720 

ATATGAAGTA AAGATAATAG AACCTTTGAA TGATTTAAGT CCATCATTAA CAGCAGTAAT 780 

ACTTTCTAAG TCTAAGGGTT GTGGGTCATC AAGTAAAAGA CGTTGCCCTG ATAACATCAT 840 

TTACTAGCAn CACGACTT 850 
(2) INFORMATION FOR SEQ ID NO: 685: 

(i) SEQUSNCE CHARACTERISTICS: 

(A) LENGTH: 1747 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDSDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 685: 

20 TTAGTATTTT CAGGnTGGAA ATTGATGTTT GAAATTCACT GAAATGGGCC AGAACCTgAA 60 

ATGoAACTTT ACCAACAATT TGGtCTTCAT CAATGAGGCC AAACGCACGG CTATCTTTAC 120 

TTACTTCACG ATTATCTCCA AGCACTAAAT ATTTACCTTT TGGAATCACA TTTGATTTAG 180 

GATTCGCATT CGGTAAATCT TTAACTTGGA AAGTCCCAGT AATGTAATCA CCTTGTTTAT 240 

GTTTTAAATT GTAGTTTAAA TATGGTTCAT CTTGTTTTTT ACCATTGACA TATAATGTAT 300 

CATTTTTGTA TTCTACTTTA TCACCAGGAA CACCGATGAC ACGTTTAACA TAGTCATCAT 360 

TTITGTTTGC ATGGAAGACA ACTACATTAC CTTTTTCCAA ACCACCTGTT TTATATCCAA 420 

CAATGTTTAC AGCTACTCGC TCGCCATCTT TCAAAGTTGG ATCCATTGAT TCACCTTTAA 480 

2^ TTGTATATGG CGTAACAATA AATTTACCTA CTATAAATAA AATGACAAAA GCGACTGCAA 540 

TTGAAATAAT CCATTCCAAT ATTTCTTTTT TCAATTTTGA CACCTCTTTT TAAGATTTGA 600 

ACTGAACAGT CCATTTTGAA AAAGGATAGT ATCGTAAACt AACATTACCA ATAATAtCCT 660 

TTTTATCGAT TAAACCAAAT TGTCTTGAAT CGTGCTTGTk ATTATCTTGA TCATTTAGCA 720 

CAACAAAATT GTTTGGCGGA ATAATATCAC CATCTAATTC TTTAAAATTG CGCAAACTAA 780 

AATCTTTAAT TTTTCTGTTC TTGGCATAAG ATGCGTCAAC CGGTCGGTCA TCACGGTATA 840 

ATTGTCCCTG ACGAAACGCC ATTGATTGAC CAGGTTTGGC AATAATTCGA CTAGTATATA 900 

TCTCGTTACC ACGCCTATAT GTAATGATAT CACCATTATT CAATTGATTA AATGTAACTT 960 

TAATTTTATT TACAATAACA CGATCCCCTT TGTTAAGGGT TGGTGACATA TCATTATTCG 1020 

GAATGACATG ACCAACTATT ACAAAAGTTT GTACGAACAG TACAATGATA ATAGCAAGTA 1080 

TCAATGAAAT CAAATATTTT ACAACTTTTT TCACGATGTC ACTCCTTTTT CGATCCCATA 1140 
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ATCCCTCTTA AAGGATGCGT TAAAATTGTA GTAATTTCCT TACCTAAATA ACCTAAAATA 1260 

ATTGTTGAAA CTAACTTTGA TGATGCCAAA ACAATCAAAT AATATTTAGG TCTAATATGA 1320 

GATAGACTCG CTACAAAATT TATTAATGTA TTTGGCGTAA AAGGAAAACA AAGTAAAATA 1380 

AACAATGGGA TTAATCCTTG GCGATCAATA AAACTAATCA AGCGTTGAAC AGCAGTACGT 1440 

TGTTTAATTC GCTGCATCCT CTCAGTGTTC ACCAATCGTT TACAGATCAA ATAGACTGTA 1500 

AATGTTCCAG AAATTAATCC AAGCCAACTA ATCAATATAC CTAAAATAGG TCCATAAGCT 1560 

TGAATGTTAA TTAAAATATA GAGTGCTAAA GGAAATACTG GAATTATAGC TCTAATATAT 1620 

AACAATATAA ATCCAGGTAA ATAACCAAAC TGTCGAAATA TCTCAAACCA TTCTTCTACT 1680 

TGATGAAACG ACAAATCATC AATCCCTTTC TTTGGTTGAA GATAATTATT CTTACATTAT 1740 

AAAGTTA 1747 
20 (2) INFORMATION FOR SEQ ID NO: 686: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 645 base pairs 

(3) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



15 



30 



35 



<xi) SEQUENCE DESCRIPTION: SSQ ID NO: 686: 

CGTAAAGATT ACTATTTAGG AGGGTGACTA TGAAAAAGAA ATTAGGTATG TTACTTCTTG 60 

TACCAGCCGT AACTTTATCA TTAGCCGCAT GTGGGAATGA TGATGGAAAA GATAaAGATG 120 

GCAAGGTAAC AATTwAAcGa CaGTTaTCCm TTGCAATcAT TTgCAGAGCA AATTGGTGGA 180 

AAACACGTGA AGGTATCATC AATCTATCCA GCAGGGACAG ATTTACATAG CTATGAACCA 240 

ACACAAAAAG ATATATTAAG TGCAAGCAAG TCAGACTTGT TTATGTATAC AGGGGATAAT 300 

40 TTAGATCCGG TTGCTAAGAA AGTTGCATCT ACTATCAAAG ATAAAGATAA AAAACTGTCT 360 

TTAGAGGATA AATTAGATAA AGCAAAGCTT TTAACTGATC AACACGAGCA TGGTGAAGAG 420 

CATGAACATG AGGGACATGA TCATGAGAAA GAAGAACATC ATCATCATCA TGGTGGATAT 480 

GATCCACACG TATGGTTAGA TCCTAAAATT AACCAAACTT TCGCTAAAGA AATTAAAGAT 540 

GAATTAGTGA AAAAAGATCC AaAACATAAA GATGACTATG AGAaAAACTA CnaAAATTAA 600 

ACGACGATCT TAAGAAAATT GATAACGATA TGAAGCAAGT TACAA 64 5 

(2) INFORMATION FOR SEQ ID NO: 687: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 956 base pairs 
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(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



5 

(xi) SEQUENCE DESCRIPTION: SBQ ID NO: 687: 





TTTGTTACTG 


CTTCTAAAAT 


AATATCCTTT 


A ATTTJ'PTTA A 
/InX X^ X X X/vl 


PATfZTTnnAT 
Wi^XVVX X\j\3AX 


TVIT'r'ATATGA 


bu 


70 


GGTC5ATGGTA 


CATTAAAAGG 


ATTTA ATTf^ A 


XCXAX X IwXVa 


^ R "P R ^*^/*' R 
Wil AX X^AX X 


X A X VjAVmA X V,. X 








A A AT AfS^VlTT 


G A TP A TTf^ A 


uX X AV. X Aw X X 


XAX XAviAX X\> 


U X t- X xQTvjAC 


loO 






TRPf Ar'P AGT 


ATGAATA A/^H 


Aijr XAVjrAlvy X X 


TCATATAX X X 


CCTC KJIKTAI, 


240 






XAnX XMXunX 


AMAAX AX XAl 


•P/^ R T'TV R JV R 

X CATAAAACG 


ACAAGGAAGG 


G AAATG ACG C 


300 






1 Xiv\l>il iVaV. 


AX XALiAKJOX 


CCAGCn VaCTG 


CCGGAAAAAG 


TACAATTGCG 


360 








AXLiAAlVvAX 1 


X ATG X A X A 


CAGG AG CAAT 


GTATCGTGCA 


420 


20 






AX irU\A\JPJ\A 


ACTGAGCiAvrx 


TTGCAAAACT 


AGTTGACCAA 


460 




ACAACATTAG 


ATTTAACTTA 


TAAAGCAGAT 


AAAGGTCAAT 


GTGTCArriT 


AGATAACGAA 


540 


25 


GATGTAACAG 


ACriTl-rAAG 


AAATAATGAT 


GTGACGCAAC 


ATGTTTCATA 


CGTTGCATCT 


600 


AAAGAGCCAG 


TACGTTCATT 


CGCCGTTAAA 


AAACAAAAAG 


AGTTAGCTGC 


AGAAAAAGGT 


660 




ATCGTAATGG 


ATGGTCGCGA 


TATCGGAACT 


GTAGTGCTAC 


CAGATGCAGA 


•riTAAAAGTA 


720 


30 


TATATGATTG 


CATCAGTTGA 


AGAGCGAGCA 


GAAAGAAGAT 


ATAAAGATAA 


TCAATTAAGA 


780 




GGTATCGAAT 


CAAATTTTGA 


AGATTTAAAA 


CGTGATATTG 


AAGCTCGTGA 


TCAATATGAC 


840 




ATGAACCGTG 


AAATATCACC 


ATTAAGAAAA 


GCAGATGATG 


CAGTGACATT 


AGATACGACm 


900 


35 


GGCmAGTCGA 


TTGAAGAAGT 


TACTGACGAn 


ATTTTAGCGA 


TGGTGAGTnC 


AATTnA 


956 



(2) INFORMATION FOR SEQ ID NO: 688: 

(i) SEQUENCE CHARACTERISTICS: 
4^ (A) LENGTH: 1166 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

45 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 688: 
AAAAGGGAGG AAAGAGAACA GTTAAATATG J^XKQM<M<1 AATTTTGTTT TCGGACAGCA 60 
5^ GGOGTATTAG ACGCGATTGA CAATGTCTGT rPAATTAAAC GTAATGTTTA TTTAAGCGAT 120 

GAATATTAGG TGAAAAGTTT TTGAATTTGA ATGTAATTGA GGTTTATTGA TTAGACATTT 180 
TATTGAATTG CGTGTTATTA TATAAATGTA AAAATAAGAC GACATGCGCG AACATGTCGT 240 

55 



1605 



10 



EP 0 786 519 A2 

TAATGCGGAA TGGTTTTTTT ATTTTCCGCT AATTGAAATA AAAATGACGT TTTAATATAT 360 

TATGGGCTAG GTGGTTTGTA AGAAAGGGTT AGTTATTAAT GTTTTATGAA TTAAGGAAAT 420 

TTGAGTTTAA GGTTTAATCA ATTGTGATTT TGTTGATGAA GCGTTTAGTT AGAGTATTTT 480 

CGCCACCACT AGTTACTCCT TCTCCCACTT TACCCGAGAC TGGAGAAGAg CTATCTGAAG 540 

AATAAATAGA TACTTTTTGG CCATTTTGTA GTAAACCAAG ACCTTTTAAC TkCTCGGTTA 600 

« 

GAGAATTCCA TGTATTTTTA GCATCTAGCT TTTTGTTAAA GTCAyCGTAG ACATTrTCCT 660 

TAGTTAAATC AATTTGTTTT AATCCTTTAA AGTCTATAGA TTGTGTTAGA TGGCCTCCAT 720 

^5 CATCATTTCc AGGAGCAGAA ACGCTGCTAG AATATCCATT GCTTAATAAA TAAGTAACGT 780 

TGATTGTTTC GTACTCGTTA CTTAAAATAA TATCAGAATC ATGTAAgAAT CTTTAACTTT 840 

TTTCCATAAT TGACCATCTG TCATTTTTTC TTCTGCTTTA GCCGTTTTAA CAACTTTATT 900 

20 TGTATCTAAT CCTAAGTATG AAGAATGTAA GCCTGTTCCT AATGTTGTTA ATACTAAAGC 960 

ACTTGCTACT aATGTTTTAC CTAAAAAttT TGTATTCATT TTTATTGCTC CTTtTTTTAT 1020 

ATTGTAAACG TTTACAATGA AAATATAATA ATAATTTTTT AAAAGAACAA TTAACTAAAT 1080 

ATCAAAAATG TATTAACTAT CTATTAACTA AAAAATAGAA TAATTTTTTA ACATAGTTTT 114 0 

GTTGTT7TGA ATTATAAAAA CTAAAG 1166 
(2) INFORMATION FOR SEQ ID NO: 689: 

30 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH; 10 83 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
35 (D) TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 689: 

AGCACTGAAG GATGGCTAGT TGTCATAGCA TATGCGGTCA TTGGTATAOT TATAACGAGC 60 

GTTTCTTATA TGTTGTCTAT TAAAATTTTT AACAAACAAG AACTAkAATT GTCGATTTTG 120 

GTGATGATAG TATTTGAAAT AATATTTAGA GCAGGTGATA AATCTTTACG ATTGTCATCT 180 

GTTCTTTTJcG GTGTGGAATG AAATGTGGGG GATAAGTATA GGTGACATAT CTATATTGAT 240 

TTATTTGTTT TGAGGTGGTT ATGTTGTGTG GGAATTATTT CCTTTTAGAT AGCGGGGATT 300 

AGAGGATATA TGTTATTTAT AAGTATCATT TGATGATTGT ATAGGCTAAC GATTTCCTCG 360 

GAAATATTTA AAAACCTCGA TCATGTAGCA TAACTGAAGT TTGTCACAAA AGTATAATGT 420 

GAAGTTCGAC ACTTTTGGaT TCAGTTCAAA TACTTTGACC GAGGTAAATA CTATTTATTC 480 
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TGATACTGAG ATAATCATTA CATGGTCGTG ACCTTTAAAT AAAAGGCTGA CAATATAAGA 
CATAACGAGT ATACCTAGTG AATATGAAAT ATACTTCGCG TTTGTCAGTT CATTATGGAA 
ATAAGGCGTG ATTAACCATA ATCCAATATA GAATATTAAA ACACTGATAT ACATCATATT 
AATTTCAAAC AAGTCATTTA GTTTATTGTT ATTACTAAAA ACAATTGCAG CATTAATCAC 
ACCTAAAGCG ATATTGATTA ATAGATGCGT ATACX3ATAAA CGGAAACCGA TAGATGTTAA 
TTTATGATTA ATATAATTTT CAGTAATGAT CCAATATACA CCGAAAAGAC TAATTAAAAT 
CATAAATTGG AATATATAAA TGTAACTAAA ATGATCAATG CTAAATGATG ACGAAGCTAA 
ACCAACCAGT ACCTCGCCAr AGwTAtAATT GTTAGTAACG AAAAACGTCT ACTAAATGCA 
TCATATTAAC AGGTnTAATA CAAGTATTTC TGAAATGGAA TAAGnCTGTC GCTGCATGAT 
ACQ 

(2) INFORMATION FOR SEQ ID NO: 690: 
(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 627 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 690: 
TTAATCATCT GGATGTATTT AGTATTnAGA ATAATAAnAA AACGATCATG TTGTATtTGA 
GTAGCGATTG GTTTGCGGAA TTAGGCTTTA CTTTCTTTAA TTACCACTAT ACAGCAAAGT 
TGATTAAATC ATCCTATAAT TTGAAATGTC TACTATTAAA ATTGACATAT CGATACCTTG 
ATAATCAGCC TCTTAATGAC GCTGATAyTA GAAAATTACA GGATATTATT AAAATCATTG 
CAAAAGAAGC AAGTATGGAT AAAAAGATTG CACAAAATCA ATATCGATAT GCGTATTATG 
GTGATTTGCG TGATGAGCTC GAATATATTT ATCAAAATGT AAATCAACGA TTGACATTAA 
AAAGTGTCGC TGATAAATTA TTTGTCTCAA AGTCAAATTT GTCATCACAA TTCCACTTAC 
TTATGGGCAT GGGTTTTAAA AAATATATTG ATACTTTGAA AATnGGTAAA TCGATTGAAA 
TTCTACTTAC TACTGATAGT ACTATTAGCA ACATAAGTGA nCATTTAGGT TTTAGTAGTA 
GCTCCACTTA CTCTAAAATG TTTAAAAGTT ATATGGATAT CACACCGAAT GAATATCGTA 
ATTTATCAAA ATATAATAAn TGTTTAC 
(2) INFORiMATXON FOR SEQ ID NO: 691: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 641 base pairs 



1607 



EP 0 786 519 A2 

(C) STRANDEDNSSS : double 

(D) TOPOLOGY: linear 

5 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 691: 
TTGAACGTAA TGCTAGCAAA TGACTTTGTG CCATAAAATA TTCTTCCCAT TTGATTCTTT 
CCAAGATGTT CACCTTCCAT ACTTAAAATT TAGTAACATT TTCTAATAAT ATAAGATTAA 

10 

TCACAAAAAA TAAAATTTGC AATTAAAATA ATCCATTATG TCGTGAAATA AGATTTCAGT 
TTATCAAAAG TTTTACTTCC AAAACCTTTT ACTTTTTTCA AATCGTCAAT TTCTTGAAAT 
IS GCACCTTGTT GGTTGCGATA TTCAACAATT GCATTAGCTT TAGCTTGCCC AACTCCAGGA 

ACAGACATCA ATTCTGATAC AGATGCCGTA TTTAAATTTA CTTTAGTATT ATTTGTGTTC 
CCaTTTTTTT CGTGCACACT GTTTACTTCA ATTTGTGGTT CAACATTCTT TTGTCCTTTA 
TGAGGTATGA AAATCATTTT TTGATCTGTT AATTTTTCAG ACAAATTAAT TTGACTTACA 
TCTGCATCCT CCAATAATTG TGCTTTATCA AGTAAATCAA CTACTCTATC CTTAGATGTC 
ATTTTATAAA CATTAGGATG TTTAACAGCA CCTTTTACAT CGACATATAC AGGACCCTTA 

25 

TTTTTGGAAT TATCTCCATC TTTGACCTGG ACATCTTCTA C 
(2) INFORMATION FOR SEQ ID NO: €92: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 631 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 692: 

TATTAAAGnA CTTGATGAAC CAAATCATAA AAAGCnATAT ATGTTATTTG CAGCTGGCAT 60 

TGTGTTnGCA ACTATTTTAC TTATTTCGGC ACATTTATAC AGCAGAAAGA GAGGTAACCA 120 

AGTTTGAGAA TCATAAAGTA TTTAACCATT TTAGTGATAA GCGTCGTTAT CTTAACCAGC 180 

TGTCAATCTT CCAGTTCTCA AGAATCAACT AAATCCGGCG AATTCAGAAT CGTACCAACA 240 

ACTGTTGCAT TGACAATGAC ATTGGACAAA TTGGATTTAC CAATTGTCGG CAAACCCACG 300 

TCATATAAGA CATTGCCTAA TCGTTATAAA GATGTACCGG AAATTGGTCA ACCAATGGAG 3 60 

CCGAATGTTG AAGCTGTTAA AAAGTTAAAA CCAACACATG TTTTGAGTGT GTCAACGATT 420 

AAAGATGAAA TGCAACCATT TTACAAACAA TTAAATATGA AAGGCTACTT TTATGATTTT 480 

oATAGTTTAA AAGGGATGCA AAAGTCGATT ACACAATTAG GTGaTCAATT TAATCGTAAA 540 
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GCAGCTAAAC AAAAGAAACA TCCCAAAGTA T 631 
{2] INFORMATION FOR SEQ ID NO: 693: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1111 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 693: 

AATTTAACTA TGTTTTCCAC ATTGTTTCAT GTCACGAAAA GGACAACGCG CGACTATAAG 60 

TATCAACTAT TTCCACAAGT TTTATTGGTG TTTTTATTAT TCATCGATAC GCTTCATTTT 120 

CATCTCTCCA ACACAAAAAA GAAGCTAAGC AACTTATGTT GCCTAACTCC TCTATACTAT 180 

20 CCATATTTTA CTATTATCCA TATTTCATTG AATTATCTAA TGTTGGcTTC TATTTTTTCA 240 

ATATTTCTAC CGTCAATGAC GTCACTCATG CGATTTGTTT GTAATTTTTT ATTAAGTTCA 3 00 

AACGTATAAT AGCCGCCATC TTTCATTATC ACTTTTATCT TACTATCTTT AGOAAACTTT 360 

TTATACAGAT CAAAATTTTG AATTAAATAC TGTCTCAATT TAAAGTCGAG TTCTTTAAGT 420 

GAAATCTCTT CTTTATAAAT GTAGTGTACT CTACCGTACG TAGCAATACC GTCACCTTCA 480 

TCTCTCTTGA TTTGAAATCT TGGTGCGTTT ATATAATCAT AATAAGCGTC TT6ATTTTTC 540 

TTAGTGACAC CACCATATGA AAACACTGTG CCATTACGGT TTTCCGCTTC TTTAACAACA 600 

AATATGTCTA ATCCCGGATT TTTACGTGCT TTAAATCTTT CAATATCTTT ACCAAATATC 660 

TGTACTCTTG TGAATTTTCT ATTTTTATCA AAGATAAGGT AATGCTTGCC ACCTTTGCTA 720 

TAACGATAAC CAGTAACATT TTTAAGTTCC TTACTTGCGC CACTATAGTA ATCTCTTAAG 780 

TCAAAGATAT CTTTTGTCAC ATTTTCATAT TTTGCTTTAT GTTCACTCGC ATTTACAGTT 840 

40 TGATGCAATG ACGTTATTGT TCCTGTTGCT AAAATACCTA ATGCTAAACT TGCTTTCGCA 900 

ATTGCTGTCA TTTTCATAGT TGTATGCTCC ATTCGTAATT ATTAGATTTG TTCGCTTACG 960 

TCTATTGAAT CATACAGCTT TATTATAGTT AGCGTATTTG ACCTTTCACA TTAAACCATG 1020 

TTTAATAATC ATTGAATCAT TATTAAGTAA ATTAAGGAtC TATAATGTTC GTTAAATAAA 1080 

CTGAnCCCGT TGTGCTTCAC ACCCGnTnGA T 1111 
12) INFORMATION FOR SEQ ID NO: 694: 



(il SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 426 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 694: 
TTATGGATGG ATTAAGAGGT CGTGTTGAAA AAATCAACGA TAACTCTGTT ATTGTTGACT 
TAACAATTAT GGAAAATTTT AATGACCTTG ATTTACCGGA AAAAACTGTT ATCAATCAXA 
AACGATATAA GATTGTTGAA TAAGAAGGTA AGTTATAATG AATAAAATCT CGAAGGCTTT 
AACTTGGTTT ATTATAAGTT TCATTATATT TCATCTCATA TTATTTATTA TGTGGGGCGA 
ACACCAAGAA TACTGGTATT TATATACAGG TATAATGCTA ATTGCTGGTA TCAGTTATGT 
ATTTTATCAA AGAGATATTG AATCTAAGCG GTTGCTTACA TCAATTGGTG TTGGTATTAT 
TACGGCAATT ATTTTAATTA TGCtTCAACT TTTATkCTCA CTTATAACTT CTAATTTAAG 
TTATAG 

(2) INFORMATION FOR SEQ ID NO: 695: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 737 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 695: 
AAAAGGGGnG TAAGGTTTAG CTCAAGTACG AGAAGTCTTT GGTGATGAAG CAATTGATGA 
AAATGGTGAG ATGAATCGTC GTTATATGGG TGATCTAGTG TTTAATCATC CAGAAAAACG 
CTTAGAATTA AATGCTATCA TACATCCTAT CGTGCGAGAT ATTATGGAAG AAGAAAAGCA 
AGAATATTTA AAACAAGGAT ATAATGTAAT CATGGATATT CCATTATTAT TTGAAAATGA 
ATTGGAAAAT GCAGTAGACG AaGTGTGGGT TGTATACACT TCTGAAAGTA TACAAATGGA 
TCGTTTAATG CAACGTAATA ATTTGTCATT AGAAGATGCG AAAGCACGTG TCTATAGCCA 
AATTTCTATT GATAAAAAAA GCCGAATGGC CGATCATGTT ATCGATAATT TAGGGGATAA 
ACTTGAATTA AAACAAAACC TTGAGAGATT GTTAGAAGAA GAAGGTTATA TTGAAAaGCC 
GAATTACGGA GAAGAAGATT AATATTACAC TATAAATAAG TCATTACTTT ACGTACGCGT 
TGATGTATGT AAGTAATGAC TATTTTTTAT AAAAAAGATA AATAAATCAA CGGAAAACGC 
TTTCAAATTT CATATAATAT GCTATACTAA TTCCATAAAG TATAACACAT AAAGATCAAG 
GGGTGCTTTT AATGTCAACG AATATTGCAA TTAATGGTAT GGGTAGAATT GGAAGAATGG 
TATTACGTAT TGCATTA 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 432 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



10 



15 



Cxi) SEQUENCE DESCRIPTION: SEQ ID NO: 696: 

AACGATAAGA ACAAAAGATA TATTACAAAG CGTTTATTTA AAACGTTATT TATTACGCGC 60 

GATGATGGCA GGATTTATTA TCGGGATTAT TACGGTCTTC GTATTATCAG TTAAAGCAAC 120 

ACACGAACCA GATTTACCGC CAGgCATTGT GAATATGGCC AGTGCCATTA CATTCAGCTT 180 

TGCGTTAGTA CTCATTTTAT TTACAAACTC CGAACTACTA ACCAGTAACT TCATGTACTT 240 

TACTGTAGGC CTGTATTmTA AAGTAATTAA ACCAACTAGA GTATTGaAAA TATTTTTATT 300 

20 ATGCTTTGCA GGAAATATTT TAGGTGCTGC TATTTyATTT AGTTTCATGC GTTTTTCAAA 360 

TGTAATGACG CCAGATAwGt TAAAyCAGTT ATCAGCAGTT ATAGAGCATA AAACGTTGTC 420 

TACTGGTTTT GT 432 

(2) INFORMATION FOR SEQ ID NO: 697: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 782 base pairs 
(B> TYPE; nucleic acid 
30 IC) STRANDEDNESS: double 

(D) TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION: SSQ ID NO: 697: 



CTTTTATACG 


AAAGTTAAnA 


TCAAATATAA 


CATTAATGTT 


TGATGGGGAT 


TTTGCGGGTA 


60 


GTGAznGCAAC 


ACTTAAAACA 


GGTCAAAATT 


TGTTACAGCA 


AGGGCTAAAT 


GTATTTGTTA 


120 


TACAATTGCC 


ATCAGGCATG 


GATCCGGATG 


AATACATTGG 


TAAGTATGGC 


AACGATGCAT 


180 


TTACTGCTTT 


TGTAAAAAAT 


GACAAAAAGT 


CATTTGCACA 


TTATAAAGTG 


AGTATATTAA 


240 


AAGATGAAAT 


TGCACATAAT 


GACCTTTCAT 


ATGAACGTTA 


TTTGAAAGAA 


CTAAGTCATG 


300 


ATATTTCGCT 


TATGAAATCA 


TCGATTTTGC 


AACAAAAGGC 


TTTAAATGAT 


GTTGCACCAT 


360 


TTTTCAATGT 


TAGTCCTGAG 


CAATTAGCTA 


ACGAAATACA 


ATTCAATCAA 


GCACCAGCCA 


420 


ATTATTATCC 


AGAAGATGAG 


TATGGCGGTT 


ACATTGAACC 


TGAGCCAATT 


GGTATGGCAC 


480 


AATTTGACAA 


TTTGAGCCGT 


CAAGAAAAAG 


CGGACnAGCA 


TTTTTAAAAC 


ATTTAATGAG 


540 


AGATAAAGAT 


ACATTTTTAA 


ATTATTATGA 


AAGTGTTGAT 


AAGGATAAGT 


TCACAAATCA 


600 
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TATCAGTGAT GCTGTGCAGT ATGTTAATTC AAATGAGTTG AGAGAAACAC TAATTAGCTT 
AGAACAATAT AATTTGAATG ACGAACCATA TGAAAATGAA ATTGATGATT ATGTCAATGT 
TA 

(2) INFOR>tATION FOR SEQ ID NO: 698: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 714 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi> SEQUENCE DESCRIPTION: SEQ ID NO: 698: 



AAATCATTGG 


CAAAATATAC 


GAATTGCATT 


TAAATCGTCA 


ATTTACATAT 


ATTTTTGCGT 


AGTAATCAAT 


CGTTATCATT 


GTTA'ITTATC 


GTTACATTAT 


TTCGAGTATC 


AGTATGTATT 


TCGGGCTTCG 


TTTGATAACG 


ACATTTCTTT 


GTGACATCGC 


TTCATCAGTG 


TAACAACAAA 


TACAATGATT 


TCGTGATGTT 


AGTTACCCAT 


TTTATGTGTT 


GCATAAAATA 


TGTTGTTATA 


AAACATTTTA 


AATCA'i"r'i"i'A 


TATAAACAAT 


CTATATATTT 


TTGGCATTTC 


CAAAATATCA 


CTTGTTATAT 


TAAAAACCGA 


CAAGACATTT 


TATCTTATCG 


GTTGAAATTT 


GTTATTGTTA 


TTTGTAATGT 


TTTTAGGTTT 


CTTTTTAATA 


TAATATATTT 


CAGTGAAAAT 


ACATGATTGA 


TTGTGATTTC 


ACTGAAACAT 


GGTTAATTGC 


GTTGTTGATG 


AATAACTTTA 


GCATAAATAT 


AGGAAGTTAT 


TTTGTACATC 


GCCATATATA 


GAAACGAAAT 


TATAATGACA 


GCTAGTACGT 


AACTTGTTAA 


AAATATATGA 


TGGTTATTAA 


TACCTATCAT 


ATTTAGTAAC 


GTATATACAA 


TGTTACTAGA 


AATTAATGTG 


TGAATCAGTG 


CTACTGTTAT 


TGGTATtGCG 


AACAAGAAAG 


TCATTTGATT 


TCGTGTTATC 


TTTGCTATTC 


TTCCATTATC 


TAAACCAAGT 


TTTT 



(2) INFORMATION FOR SEQ ID NO: 699: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 361 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 699: 
ACTGAGAGCA ATAATTTAGT AACTTCTACT CAAGGAATTA TTAAAGAAGC ATTGCATAAA 
TTGGGATTTG nnTTTAATTA AAGAACCTTT AAGAATGTTA CAAGTGCGTA TCCCTGTACG 
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TGGACCAACA AAAGGGGGCG TGCGTTTCCA CCCAGATGTT GATGAAGAAG AAGTAAAAGC 240 
ATTATCAATG TGGATGACTT TGAAATGTGG CATTGTGAAA CTTACCATAC GGTGGTGGTT 300 
AAGGGTGGTG ATCXSITTGTG GATCCACGTC AAAnGAGCAT TCCATGAAGT TGGAACGTTT 360 



(2) INFORMATION FOR SEQ ID NO: 70O: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 943 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 44 5 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 



361 



(xi) SEQUENCE DESCRIPTION: SEQ ID MO: 700: 

20 GTCCTTAATT GGTATCCACC TTTAGCACCG CGTACACTTC GAATTAACCC CGCATTTCTT 60 

AAAGGACCTA CAAGCTGTTC TAAATATAAA TCACTCAAAT TA T TTTCTTC AGCAATTGAC 120 

TTTAATGATA TACATCCTTG CCCCTCTTTT TTAGCAAGAG AAATCATCAA TGTAAGTCCA 180 

25 TATCTCCCTT TAGTAGAAAT TTTCATTGTA TAACCTCACT TAATTCGAAT ATTGATATTC 24 0 

CCATTTTAGC ATTTTTTGAG TTAAGATAGT ATAAGAAAGG TGTGACAAAT GTGAGTACAG 300 

AACCATTAGC ATCGAGAATG CGCCCAAAAA ATATAGATGA AATCATTTCC CAACAACATT 360 

TAGTTGGACC AAGAGGCATT ATCAGAAGAA TGGTTGATAC AAAAAAATTA ACTTCAATGA 420 

TTTTTTATGG TCCACCTGGT ATAGGCAAAA CAAGTATTGC CAAAGCAATT TCGGGCAGTA 480 

CGCAATATAA ATTCAGACAA TTGAATGCTG TAACTAACAC TAAAAAAGAT ATGCAACTTG 540 

TTGTTGAAGA AGCTAAAATG TCTGGTCAAG TTATCTTGTT ATTAGATGAA ATACATCGAC 600 

TAGATAAAGC TAAACAAGAC TTTTTATTAC CTCATTTAGA AAATGGCAAA ATCGTCTTGA 660 

TCGGTGCTAC AACTTCAAAT CCTTATCATG CTATCAATCC AGCGATTCGT TCAAGAGCGC 720 

AAATTTyCGA GTTATATCCT TTAAATGACG AaGATGTGCG CCAAGCGTTA ACTCGTGCAA 780 

TAGAAGATGA TGAGAATGGT TTGAAAmCAT ATCaACCCAA AATTGATGAA GATGCCATGA 840 

45 CCTACTTTTC TACACAAAGC CAAGGTGATG TTCGTAGTGC GTTAAATGCA TTGGAATTAG 900 

CTGTATTAAG CGCAGATAAT GACAAAGACG GTTATCGACA TGT 943 
(2) INrORMATICN FOR SEQ ID NO: 701: 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 701: 

CATTAAGTGA AGTTGTTGAT ACACCCATGC ATCAAGTCAA TTGTTCTGTT GATTTAGATA 60 

CAGAAAGCTT ATTAGGCTTT AAAACAATTA AAACAAATGC GGAAGGTCAA CAAGAAATTG 120 

TCTTTGTAGA TGGTCCAGTT ATTAAAGCTA TGAAAGAOOG GCATATTTTA TATATTGATG 180 

AAATAAATAT GGCTAAACCT GAAACATTGC CTGTATTAAA TGGGGTCTTA GATTATCGTC 240 

GTCAAATTAC GAATCCATAC ACTGGTGAAG TAATCAAAGC TGTACCAGGA TTTAACGTTA 300 

TAGCAGCGAT AAATGAAGGT TATGTTGGtA CTTTGCCAAT GAATGAAGCA CTAAAAAAaT 360 

75 CGCyTTGTTG TTaTTCACGT kGATTATaTT QATGGGGaCA TTTAAAAAAT GTGAnTAAGG 420 

AGCAAGGTTT ATTACAAGAT GTTAA 445 
(2) INFORMATION FOR SEQ ID NO: 702: 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 752 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
(D> TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 702: 

TGCAAGATAA ACAAATTTGT CATTGTTTTG GTTGTAAAAA AGGTGGCAAT GTTTTTCAAT 60 

TTACTCAAGA AATTAAAGAC ATATCATTTG TTGAAGCGGT TAAAGAATTA GGTGATAGas 120 

TTAATGTTGC TGTAGATATT GAGGCAACAC AATCTAACTC AAATGTTCAA ATTGCTTCkG 180 

AyGATTTACA AATGATTGAA ATGCATGAGT TAATACAAGA ATTTTATTAT TACGCTTTAA 240 

CAAAGACAGT CGAAGGCGAA CAAGCATTAA CGTACTTACA AGAACGTGGT TTTACAGATG 300 

CGCTTATTAA AGAGCGAGGC ATTGGCTTTG CACCCGATAG CTCACAT T TT TGTCATGATT 360 

40 TTCTTCAAAA AAAGGGTTAC GATATTGAAT TAGCATATGA AGCCGGAT7A TTATCACGTA 420 

ACGAAGAAAA TTTCAGTTAT TACGATAGAT TTCGAAATCG TATTATGTTT CCTTTGAAAA 430 

ATGCGCAAGG AAGAATTGTT GGATATTCAG GTCGAACATA TACCGGTCAA GAACCAAAAT 540 

ACTTAAATAG TCCTGAAACA CCTATCTTTC AAAAAAGAAA GTTGTTATAC AACTTAGATA 600 

AAGCGCGTAA ATCAATTAGA AAATTAGATG AAATCGTaTT. ACTAGAAGGT TTTATGGATG 660 

TTATAAAATC TGATACTGCT GGCTTGAAAA ACGTTGTTGC AACAATGGGT ACACAGTTGT 720 

CAGATGAACA TATTACTTTT ATACGAAAGT TA 752 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 830 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 703: 





nCGTTTTTGT 


llAAACnGCTT 


ATATGTATAA 


CTTTTCCCAA 


TTTATCATAA 


GTTTTGATAG 


60 




AAGGAGTTGG 


ATCGCTAAAG 


AAAATATCTC 


TAAAGATATC 


ATCTTCAATG 


ATAG6AATAT 


120 


IS 


TATGTCtTTC 


GCtATAAGTA 


ATTATATTTT 


TCTTTTGCTC 


ATTCGTTAAA 


GAACGACCTG 


180 


TCGGGTTATT AAACCTAGGT 


TCTATATAAA 


TCGCTTTATT 


TTTAAAATTA ATAAATCTAT 


240 




CAATGATGGT 


ATCAATTTCA 


^^^^^^^ 4k ^^^^^^^^^^^^ ^^^ft 

TTAATTTGAT 


TATAAGGAAC 


ATCAATATGT 


CTAAAATTCA 


300 


20 


ATTGCTCAAA AACATTTGTA 


GAGTGAATAT 


ATGATGGTGT 


ATTCGAAATT 


ATTATGGCAT 


360 




CTTGACCTAA 


AAACCCAATA 


GATAAAAGTT 


GAATGGCATG 


TAAAGCGCCT 


GAAGTGATCA 


420 




TTACATTTTC 


TCTACCTACA 


TTTATACCTT 


GCTTTGACAT 


TCGTTCAACG 


ATAATATCTC 


480 


25 


TTAACTTGAT 


ATAACCATAG 


CCATTATTAT 


AACCAAAAGA 


TAAGTCTTCA 


ATATGACTGG 


540 




CTGTATTAGA 


CATGGCTTTT 


TTCAATTGAA 


TATGTGGCAT 


TAACGATATA 


CCCAATTCAC 


600 




CTTTACTTAT 


ATGTATATAC 


GAATCATCTG 


TCTCAATTTT 


ATTAATTAAT 


TGCACCGTAT 


660 


30 


ACTGACTTCT 


TTGTTGAGAG 


GACCATAACA 


TCATTTCAGA 


CCACTTATTT 


GTAATATGTG 


720 




CTTCATTCAA 


ATAGTCATTA 


ACATATGkTC 


CACTACCTAC 


TTTAGTATAG 


ATAAATCCTT 


780 




CAGCTTCTAA 


TAACTCAATA 


CTTTTAATAA 


TCGTTACTCT 


ATTTACGTTG 




830 



(2) INFORMATION FOR SEQ ID NO: 704: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 659 base pairs 

(B) TYPE: nucleic acid 
40 (C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 704: 



50 



AGTGGTGTTG 


GAAAAGCTAT 


TATGAAATTA 


TTACGTGAAC 


AACAAGTTTA 


ATAAAAAAAG 


60 


AGGGGTCAAA 


TATGAAAGGA 


TTAATTATTA 


TTGGCAGTGC 


ACAAGTGAAT 


TCACATACAA 


120 


GTGCACTAGC 


AAGATACTTA ACTGAGCATT 


TTAAAACACA 


TGATATTGAA 


GCGGAAATAT 


180 


TCGATTTAGC 


AGAAAAACCG 


TTAAATCAAT 


TAGATTTTTC 


AGGAACAACA 


CCGTCTATTG 


240 
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TATTAGGAAC GCCAAACTAT CATGGTTCAT ATTCTGOAAT ATTGAAAAAT GCATTAGATC 360 
ATCTAAATAT GGATTATTTT AAAATGAAAC CTGTAGGCTT AATAGGAAAT AGTGGTGGTA 420 
5 TTGTTAGTTC AGAGCCATTG TCACATTTAA GAGTAATCGT CAGAAGTTTA CTAGGCATTG 4 80 

CTGTACCAAC TCAAATAGCA ACACATGATT CTGATTTTGC TAAAAATGAA GATGGTTCAT 540 
AITACTTAAA TGATAGTGAA TTCCAATTAC GAGCAAGATT ATTTGTCGAT CAAATTGTAT 600 

10 

CTTTTGTGAA TAATAGTCCA TATGAACATT TAAAATAATA TTAAnAAATA TGTAAATnT 659 
(2) INFORMATION FOR SEQ ID NO: 705: 
(i) SEQUENCE CHARACTERISTICS: 

15 (A) LENGTH: 400 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

20 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 705: 



nCACCATATA GTAACTGGCA CCAACTACAT TACCGTCTTT TAAAAAGATT TTTTTATAGT 60 

25 TATTATCAAC ACTATTAAAT ATTTCAATAC CTTTAATTTC TGCATTTTCT ACAATTTGAC 120 

CAGCACTATA CAAGTCACAC CCAGAAACTT TTAATGACGT AAATGTTGTT GATCCCTTGT 180 

ATCCGTTCGT TTCTTTATTT GTTAAATGAT CAGCTAATAC TTTACCTTGT TCATATAGTG 240 

30 GTGCAACGAG TCCATAAACT TTGCCGTTAT GTCTGCACAT TCACCAACTG CATATACATT 300 

GCTATCACTT GTTTGCATCA CATCATTGAC AACAATACCA CGATTACATC TAGACCTGAT 360 

CTTGGCACTC CTGGGAAGGC GGAACCACTG CATACAACTA 400 



(2) INFORMATION FOR SEQ ID NO: 706: 

(ij SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 380 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID MO: 706: 



SO 



TTAAAAATAC 


AGCTACAGGT 


AATTTTAATG 


ATTTTTCATC 


AATATCAAAT 


TTGGGATTAT 


60 


GGTGTGGCGC 


TGTAATACCT 


TTAACCAGTC 


AGAAAGAATG 


CACCTGGTCG 


TACTTTCAAA 


120 


TAATGTGAAA 


AATCTTCTCC 


AATCATCATT 


AAATCTGATT 


CATTAAAGCG 


TACATGTAAG 


180 


TCATTTGTTG 


CTTCTTTAAT 


AACTTGGATA 


TGCTTTCTCG 


TTTATTATGG 


ACAGGCAAAT 


240 
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GCTTAATCCA TTTTGTCCAT ACATGATTCT GTATATCTGA AATCGAAAGT TCTnACTGTA 360 

CCTTTACAAA ATGCCTTGnn 380 
^ (2) INFORMATION FOR SEQ ID NO: 707: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 400 base pairs 

(B) TYPE: nucleic acid 

10 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 707: 

75 

CAnAAAGGAT CAAAGTGATC GGTATAGTGA TAATTAGCTC CAAAGAAAGA ATATTCTAAA 60 

TCAAATCCAT ACCAAGCAGA AAGTATTAGC GAATATCAAT TTAAATGGTA CCGATTCAAA 120 

20 TAAAGAAACA CGACATATAG AATTTTTACT TGATGATTTT AGTGAATCAT ATGAACCAGG 180 

AGATTGTATA GTAGCATTAC CGCAAAACGA CCCTGAATTG GTTGAAAAAC TAATATCCAT 240 

GTTAGGTTGG GATCCGCAAT CTCCGGTGCC AATTAATGAT CATGGTGATA CAGTTCCTAT 300 

25 rGTTGAAGCA CTAACATCAC ATTTTGAATT TACTAAATTA ACATTGCCAT TATTGAAAAA 360 

TGCAGATATC TATTTTGACA ATGAAGAATT ATCTGAnCGT 400 



(2) INFORMATION FOR SEQ ID NO: 708: 

30 

(i) SEQUENCE CHARACTERISTICS: 

{A) LENGTH; 447 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: doxible 

(D) TOPOLOGY: linear 

35 ' ' 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 708: 

TGAGTTGAAC TACACAGTTT TACAACCTGA 60 

GATTAACGAA GAGTTTGAGA TTTCAAAACA 120 

CATCGAGAAC CCAAGAGAAT TTATCAATCC 180 

AAACAATGTT AAATTCTTAA AAGATCGTTA 240 

TAATATCGAA TATACTGAAG ACATCGAAGT 300 

AGGCCGTGAA GATAACCCTG GTATCATGGc 360 

AAmCTyCGGT GAATTAACAC GTAAAATGGC 420 

447 



40 TAATGCTGGT ACGGGTCATG CAGCATTAT6 

TGGTTCTATC GACATCGAAA AAGCGAAAGT 
ATTCTGGGGT CACTTAGTGA AAAGCGGTAG 
ATTACCACAC ATCAGTTATG TTAGAGGTAA 
CGAAGCGATG AAAGCTTTCC CTATGTTCGA 
AATGAAAAAA TGGATTCCAT TGATGATGAA 

SO 

GGCAAGTAAA ATTGACGArG GTmCAGATGt 
TAAAAGCATT GAAGCACATC CAAATGC 

55 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1448 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



10 



15 



30 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 709: 

GTGTCTACCT GTTTTTGTTG TTCAATTGTT AACTTTTCTT TTTGAATAGT AGTATTCGAT 60 

AATTCTTTAT CGCTTATAAA ATCATCTAGT GGATGGCTTT CTTTGAAACT TTTATTTTCA 120 

GTCATCAATC ATCTCTCCAA TAGTTGCTAT TTTACATCAA TCTTGATGAT GTTTTTGATG 180 

TAACTTATTT AATTCCATTT CAATATCTAA ACGTTCATAA TCATCTTCGT TGAGACGCTT 240 

TAAATCAGCG ATTAATGTTC GTTTGACCTC ATCCAAAGTA ATTCGTGTTT GTTCTAACTT 300 

20 TTGCTGTTCA TTAATTGATT TTTTGGGCAT TTTTGCTAGA CGTGTATATG CATCAACCAA 360 

ATTTAAAGCA TTATCAATAT GAGAATAAAA AAAGCCTTCA ACTTTATAAA ATGATGCAGG 420 

TCTCTGTCTA ACTGTCGTAT AAATAGAACG TGAAATTTGG TATATATCAT TAATCTGCCT 4 80 

25 AAAATCTTTA ATTGATCTTA TATTGACATA CGTTTTTAAA ATACCTCTAA GTTTTTGGTG 540 

TGTATGATTT AACTGATTTC GAATATAGCG ATAGTCTTTT CTAGTCAAAC CAATTTCGTT 600 

TAAATATTTG CGTGAAGTGA GTTTTTGTAT CGGTAGGTAT GTCATTAAAA AGCCAACAAT 660 

ACCAATAGAC ATATCAATTA AAAAAGATAC ATCAAGTGCA ATCATCCCAA ATATGCTTGT 720 

TAAAAACGCT ACAGGAATTC CCACTAACAC CCCAAATATA TGAGAAATAT TATATCTCAC 780 

TGTCATCTTC CTTTATTTAG CATTTTATAT TGATCGAAAA TCCGATAATT TTTGATTTAG 840 

TTCTAACTCT TCAAGTTGAT GGCTTGTTAC ATTTGATGCT GGTGAGGCAC CTTCAATTAC 900 

ACCTTGAATA AATCTCTCTA TATCTGCGTC ATCCCCTTGT GCATATATCT CTACATAGTC 960 

■ ATCTACATTT TGAACAGTAC CGACAATGTT ATAGTTCATT GCAATGCGTT GTGTAAAATA 1020 

TCTAAATCCG ACGCCTTGAA CGCGTCCGAA TACTTGTAAA TGTATATGtC TCaTTTTTAC 1080 

CACCTCATAA TGTTATTATA CGTAGTTTTA CTTAAAAAAA CTAATAATTA CTATAGTTAC 1140 

45 TACTTTGTTT GTTTCAAGTC GTCAAACTTG ATTTTCAGAG GATAAAGGTA TAAAAATAAG 1200 

TATAGAGTTT TTGAAGTATG GAAGGGGTCT TTAATAATGT GGACAGTTAC CAAAATTAGA 1260 

GCCGATTATG AGGGATGGTG GTTATTCAGT GACTGGCCAG AAAACATTGT TGAAAAATAT 1320 

CAATATCAAG ATTTTGATGA CATGTTTAAG CACTATCAAC AATTGATTAA TCAATGTAAA 1380 

GTTCAGTTCG ATAACTATGT CACAGGCAAA TATAATATTT ATGCATTTTA TAATAATTGT 1440 

55 



35 



40 



SO 
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(2) INFORMATION FOR SEQ ID NO: 710: 

(i) SEQUENCE CHARACTERISTICS; 

(A) LENGTH: 519 base pairs 
{B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



10 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 710: 

GCTGnAAAAT ATGTTAGAAG CAGATGCATG GGCAAAGCTG GGGTCCTTAT TTATTGTCAG 60 

GTAAAGATGT CTTCAATTCA ACTATTGGAA TATATGGTAT GGGAGATATT GGTAAAGCTT 120 

TTGCAAGAAG GTTGCAAGGG TTTAATACTA ATATTCTTTA TCATAATCGA TCAAGACATA 180 

AAGATGCAGA GGCGGACTTT AATGCAACAT ATGTTTCTTT TGAAACGTTG TTAGCAGAAA 240 

20 GTGATTTTAT CATCTGTACA GCGCCACTTA CAAAAGAAAC ACATCATAAA TTTAATGCTG 3 DO 

AAGCATTTGA ACAAATGAAA AATGATGCAA TTTTTATTAA TATCGGTAGA GGACAAATTG 360 

TAGATGAAAC AGCATTAATC GATGCACTAG ACAATAAAGA AATTTTAGCA TGTGGTTTAG 420 

ATGTATTAGC AAATGaACCG ATTGATCaTA CACATCCATT aATGGGaCGT GaTAATGtTC 480 

TGaTTaCACC aCACATTGGG TAGGCGCATT CAGTTAACn 519 
(2) INFORMATION FOR SEQ ID NO: 711: 



75 



25 



30 



35 



40 



45 



SO 



(i> SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 134 9 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 711: 



CTATTACAGG 


TGGCGAACCA ATGTTTTCTA 


AAAAGTCTAT 


TAGAAATGTT 


GTTAAACCTC 


60 


TATTAAAGTA 


TGCACATCAT 


CGAGGTATAT 


ATACACAAAT 


GAATTCAAAC 


CTAACATTGC 


120 


CTCAAGATCG 


TTATTTAGAT ATTGCTGAAT 


ATATCGATGT 


TATGCATATC 


TCACACAACT 


180 


GGGGAACAAC 


TGATGAATTC 


GCAAATGTTG 


GCTTTGGCGC 


AATGAAGAAG 


CAACCACCGT 


240 


TAAAAGCTAA 


GTTAAAATTA 


TATGAACAAA 


TGATTTCGAA 


TGCACGTACA 


TTATCAGAAC 


300 


AAGGAATGTT 


TGTATCTGCG 


GAAACAATGC 


TCAATCAAAG 


TACGCTACCA 


CATTTACGAA 


360 


AAATACATCA 


AGAAGTCGTT 


CATGATATGA AATGTAGCAG 


ACACGAGATT 


CACCCTATGT 


420 


ATCCAGCTGA 


CTTTGCAAGT 


CAATTAAATG 


TGTTAACTCT 


AGCGGAAATG 


AAAAAGACAA 


480 



55 
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TGTTTCCATG CTTAAAGGAT GATGAAGATC AAAAGTTACT ATCACGTTTA AGAAATGCTA 600 

AAAATGTAAC GACTAGAAAT GACCCGGATG GCCGTAGTCG TTTAAATGTC AATGTATTTA 660 

CAGGTAATGT AATCGTAACT GATTTCGGAG ATGAAACAGG TACAATTTCG AATATACAAA 720 

AAGATAAATT AACAGATGTA TTTGATAAAT GGTTATCCTC TGATCTTGCT AAATCATTAA 780 

ATTGTCATTG TTCCGAGTTT AGTTGTTTAG GGCCAAATGT TCTTGTTAAA AATATGTACT 840 

ATCCGAATAT GGATTTTAAA GATAATGAGC GTCATATGCA CAAACAACCA CAAATTATAC 900 

AATTTTAAAA ACTCITAATT ATGCGGAGAA GCACTTTATC GATAAGTAGT CTCCGCATAT 960 

TTTAATGCTA TTATAAAATA AAAAACAATT AATTGCTGGC AGTACTCTAC TTAAATAATA 1020 

AAGGGCATTT AATAGGACTA ATAGTCTATA ATAAAAGGGG TAAATTTTAA CTAAAAGCAT 1080 

AAACGTGCAT AATCAAAAAG ACAGaTTGTA GGTGGAATAT TCGAaCATAA CAGTTCAATT 1140 

2^ CATCCTTAAC AATCTGTCTT TATATTTTTA GTCTCTAATA TGrTGCACTT GAGCTAAATA 1200 

TTCAATTGTT gTTTACTTtC AaTGCGaCGt GCTTttCTtC GTtCAaCaCG TgwGGTGCTG 1260 

TATCATAAAA CCATTTTTCA ACATCATCTT CTGGATATAC ACCAGGTACA TGTTTAGGTT 1320 

25 GCCTTCATCA TCTAACGCAA CAAATGTAA 13 49 
(2) INFORMATION FOR SEQ ID NO: 712: 



15 



30 



35 



40 



SO 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 377 base pairs 
(a) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 712: 

GAAATTAAAA AAGCAATTGG ACAAGATGCA ACAGTGTCAT TGTTTGATGA ATTTGATAAA 60 

AAATTATACA CTTACGGCGA TAACTGGGGT CGTGGTGGAG AAGTATTATA TCAAGCATTT 120 

GGTTTGAAAA TGCAACCAGA ACAACAAAAG TTAACTGCCA AAAnCAGGTn GGCCTGAATG 180 

GAACCAGGAG GAAnTTGAAA ATATGCTGGG GATTACATTG TGAGTACAAG TGAAGGTAAA 240 

45 CCTACACCAG GATACGAATC AACAAACATG TGGAAGAATT TGAAAGCTAC TAAAGAAGGA 300 
CATATTGTTA AAGTTGATGC TGGTACATAC TGGTACAACG TCCTTATACA TTAGATTTCA * 36 0 

TCCGTAAAGA TTTAAAA 377 
(2) INFORMATION FOR SEQ ID NO: 713: 
(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 528 base pairs 

55 
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(C) STRANDEDNESS : doilble 

(D) T0P0LCX3Y: linear 

5 

(xi) SBQU2NCB DESCRIPTION: SEQ ID NO: 713: 
AATGAAnCGA AAAATGACTA TAAAAAGTTT AAAGTGTTTT CACTTATTTC AACACTTGTC 60 
70 ATTGTCATTT TAGCAATTAT AAGATTTGTT CATAAAATGA TGTAATTAGA GTGAGACATT 120 
GTTTTATGTC TCAGGATCCA GTTATTCATT ATATCTACAA TATTTACGAT TATATAAATA 180 
ACCCGAGATT TTAGTATGAT TCATTtCACT AAAATCTCGG GTTTCTATTT GATAATTTTT 240 
AATGGGATAT GGCATGTATA CGTTCTTGCC TTTTATCTCA TTTCCAATGA TTAATCTGGA 300 
TATTGTTCTA AAAATGCTTT CGCTTCTTTA TTAACTGTTT TAAAATCAAT ACCTTGTTGC 360 

ATCGCTGCAA AGACACATCC ACAATAACAC TGCCTAAAGA TATTATAGTC ATTACACATT 420 

20 

TCTATGGaAC GCTCATAACC TTTACTTTTC yTAAAATCAC TTGGcAAATA GTTCACaTCG 480 

TATATTTTTT GGACATCCAT ACCAAGTTCA TTGATTAATT GTGCGTTC 528 

(2) INFORMATION FOR SEQ ID NO: 714: 

25 

. (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 731 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
(D> TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO; 714: 



35 


TTTAATGGCA 


TGAAGTCACA 


GTATATAAAG 


AATCTGGTGT 


GACAATCAGT 


ATGACTAAGT 


60 




ATATAAAAAA 


AGAGCAGGT6 


CGAAATAATG 


GCGAAAGAGT 


CGAAATCAGC 


TAATGAAATT 


120 




TCACCTGAGC 


AAATTAACCA ATGGATTAAA 


GAACACCAAG 


AAAATAAGAA 


TACAGATGCA 


160 


40 


CAGGATAAGT 


TAGTTAAACA 


TTACCAAAAA 


CTAATTGAGT 


CATTGGCATA 


TAAATATTCT 


240 




AAAGGACAAT 


CACATCACGA 


AGATTTAGTT 


CAAGTTGGTA 


TGGTTGGTTT 


AATAGGTGCC 


300 


45 


ATAAATAGAT 


TCGATATGTC 


CTTTGAACGG 


AAGTTTGAAG 


CCTTTTTAGT 


ACCTACTGTA 


360 


ATCGGTGAAA 


TCAAAAGATA 


TCTACGAGAT 


AAAACTTGGA 


GTGTACATGT 


TCCGAGACGT 


420 




ATTAAAGAAA 


TTGGGCCAAG 


AATCAAAAAA 


GTGAGCGATG 


AACTAACCGC 


TGaATTaGaG 


480 


SO 


cGTTcACyTT 


CTATcAGTGA 


AATAGCTGAT 


CGATTAGAAG 


TCTCAGAAGA 


AGAAGTGTTA 


540 




GAAGCAATGG 


AAATGGGACA 


AAGTTATAAT 


GCGTTAAGTG 


TTGATCATTC 


CATTGAAGCT 


600 




GATAAAGATG 


GTTCAACTGT 


TACGCTATTA 


GATATTATGG 


GGCAACAAGA 


TGACCnTTAT 


660 



55 
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to 



15 



30 



35 



CGAGAAATCA T 731 
(2) INFORMATION FOR SEQ ID NO: 715: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 830 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 715: 

TTTTAGrGGa AAGCGaATTA GtCaTATwCg CaGCAGATwG aATGATTGaA AAmGaAATTG 60 

aTTCGATTCC AATTGTAAGA AAAAAAGATA ATCAAAAGTA TGAAGTAATT GGAAGAATTT 120 

CCAAAACAAC AATAGCTAAG TTATTAGTAG CATTATATAA AGAATAGGTG AGAAGTAATG 180 

20 GAAAAAATTA AAATTATCGT AGCTTCAGAT TCTATAGGTG AAACGGCAGA GTTAGTTGCT 24 0 

AGGGCAGGTA TTTCACAATT CAATCCTAAG CAATGTAAAA ATGAATTATT AAGATATCCA 300 

TATATTGAAT CTTTTGAAGA TGTTGATGAA GTGATTCAAG TTGCAAAAGA TACAAATGCT 360 

ATCATTGTTT ATACACTTAT TAAACCTGAA ATGAAGCAAT ATATGAGTGA GAAAGTAGCA 420 

GAATTCCAAT TGAAGTCTGT CGATATCATG GGGCCATTAA TGGATTTATT ATCTGCTTCG 480 

GTTGAAGAAA AACCTTATAA TGAGCCAGGT ATCGTTCATA GATTAGATGA TGCATATTTC 54 0 

AAGAAAATTG ATGCGATAGA GTTTGCAGTT AAATATGATG ATGGTAAAGA TCCTAAAGGA 600 

TTACCTAAAG CTGATATTGT TTTACTTGGT ATTTCGAGAA CTTCAAAGAC ACCATTATCT 660 

CAGTATTTAG CGCATAAGAG TTACAAAGTT ATGAATGTAC CGATTGTACC AGAAaGTGAC 720 

ACCGCCAGAT GGCTTATATg GATATTAATC CAAAGAAATG TATCGCACTT AAAATAAGTG 780 

AAGAnAAATT AAATCGCATT AGAnAAGAGC GACTAAAACA ATTAnGACTA 830 
(2) INFORMATION FOR SEQ ID NO: 716: 

40 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1159 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 
45 (D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 716: 
nOAAGAACAA GTTTAnCATC TAAATGCCCG TTTAAAACTA CAACTACTTG ACGATGTTAA 60 
ATCAGTGTTT AAnTCTCAAA TGACGCAAAA TAGTGATTTT AATGAAGAAA AGAAAGTGTC 120 



55 
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AGAACGTATA AAAAAATACT TTAATAAGCA ACTCACTGAG CAAATTGCAC CAATCGTTCA 240 

ACAATTAGCA 6ATTTACATG TCATTATTAA TCCTCAGTTT AACTTTGAAT CAGCTAATAT 300 

AGAGCAACCA TTATTGCACA TCGATTTCAA CGATATGCTA AATGCATTGC CTAAACAATT 360 

AACAAAACGT AAAATTTTGA ATCCAAATGG GCAAAGAGAT ATACATGAAT CAATTTGTCA 420 

AAGTACGTTA GGATTATTAC AACCACAAAT GGGATTATTG AGGCAACAGC TTGAATTATA 430 

TGTAAAGCAA ATGGCTGTAG AAGCTGAATC GCAATTTGAA AGTTTTGAAG CTAATATTCA 540 

AACGCAAATA AACGATTTAT TAGCATTTGA TTTA6ATACA ACACTTATCA ATCAATTGAA 600 

AGATAAACAT CAACAACTGA MACThTTTT ATATTAAGAa AGAAGGAACG TTTTAAATGC 660 

CTAATAAAAT ATTACTTGTA GATGGTATGG CGCTATTATT TAGACATTTC TATGCTACAA 720 

GTCTTCATAA ACAATTTATG TACAATTCAC AAGGTGAACC TACAAATGGA ATACAAGGAT 780 

TTGTGCGTCA TATCTTTTCG GCAATACATG AAATACGCCC TACACATGTA GCTGTATGTT 840 

GGGATATGGG ACAATCAACT TTTAGAAATG ATATGTTTGA tGGTTATAAG CAAAAkCGTT 900 

CTGCACCACC AGAAGAATTG ATACCACAAT TTGATTATGT TAAAGAAATT TCAGAGCAAT 960 

25 TTGGCTTTGT AAATATTGGC GTTAAAAACT ATGAAGCGGA TGATGTTATA GGTACATTAG 1020 

CACAACAATA TTCAACTGAT AACGATGTCT ATATTATTAC GGGCGACAAA GATTTACTGC 1080 

AATGTATTAA TGACAATGTT GAAGTTGGCT AATTAAAAAA GGTTTAACAT TTATAATAGA 1140 

30 TATnCATTAC ATCGTTTTn 1159 
(2) INFORMATION FOR SEQ ID NO: 717: 
ti) SEQUENCE CHARACTERISTICS: 

2s (A) LENGTH: 574 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDBDNBSS : double 
(O) TOPOLOGY: linear 

40 

{xi) SEQUENCE DESCRIPTION: SEQ ID NO: 717: 

GATTTAATCA ATGCAGTTGC AGAGCAAGCT GATTTAACTA AAAAAGAAGC TGGTTCAGCA 6 0 

GTAGATGCTG TATTCGAATC AATCCAAAAC TCACTTGCTA AAGGTGAAAA AGTACAATTA 120- 

ATTGGTTTCG GTAACTTTGA GGTACGTGAA CGTGCTGCAC GTAAAGGTCG TAACCCTCAA 180 

ACTGGTAAAG AAATTGATAT CCCAGCAAGT AAAGTTCCAG CATTCAAAGC TGGTAAAGCA 24 0 

SO TTAAAAGATG CTGTAAAATA ATTTTACTTA AAAAGCCCTG AATAAGGGCT TTTTATTTTG 300 

CTTTTAATAC TTACAACCTG TACATAAATT GTAATGTTCT TCTAAGTTTT TAATCTTTGG 360 



45 



55 



1623 



EP 0 786 519 A2 



AACTACAAAA TATACATATG aATATTGaGa TTAATTGTTA GCGTTGaATT TACTTAAAAG 
GTAACCATGT CTACTATAGT ATTTTACGTT ATTTAAAAAG ATGAATAATG TAAATGAAGT 
AAAGGTTATT ATGAGAATTA CAAAAGCTAC ATAA 
(2) INFORMATION FOR SEQ ID NO: 718: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 493 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 718: 
AAGaTATTGA AAmTGtnAaTG GaGCACGCCC TTATTTGATA GAAGTAAAAG ACATTTAATT 
CTTACCGATG CAGGTCAAAT TTTTTATGAG AAAAGTAAAG AAATTGTtGC ACTGTATGAT 
TATTTACCAT CTGAAATGGA ACGCTTGAAT GGACTGGAAA CAGGACATAT AAACATGGGC 
ATGTCGGCAG TCATGAATAT GAAGATTCTT ATCAATATTC TTGGTGCATT CCATCAACAA 
TATCCAAATG TTACATATAA TTTGATAGAA AATGGCGGTA AAACAATTGA ACAGCAAATT 
ATCAATGATG AAGTAGATAT AGGCGTGACC ACTTTGCCAG TCGATCATCA TATTTTCGAT 
TATACTACCC TAGATAAGGA AGATTTGCGA CTTATCGTGA GCAGAGAGCA TCGACTCGCA 
AAATATGAAA CTGTTAAACT CGAAGATTTA GCAGGTGAAG ACTTCATTTT ATTTAATAAA 
GACTTTTACT TGA 

(2) INFORMATION FOR SEQ ID NO: 719: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1257 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

(xij SEQUENCE DESCRIPTION: SEQ ID NO: 719: 
GCATTGCCAA AACAATACGT TTATATTATT GAGGAACTAC TGTATAAAAG TAATGAATAT 
CAAAATAAAA AATCATATTA CGAAACACTT GTTAACCAAG TAATTGAACT TAAACAGGCA 
GATGATTTAA TTATTGGACT CGCTTATTCC GTACAACGCT TAGTCGTCGA TCATTTACAC 
GTTGTCGGTG ATATTTATGA TCGTGGACCA CAACCAGATA AAATTATGGA TACACTGATT 
AATTATCATT CCCTAGATAT TCAATGGGGT AATCATGATG TGCTTTGGGT TGGAGCCTAT 
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GATATTATCG AAGACGCTTA TGGCATTAAT TTAAGACCAC TGCXTACTTT AGCTGAAAAA 
TACTATGACG CAGATAATCC TGCTTTTAAG CCTAAAAAAA GACCTGACAA ACACGAACGT 
TTAACTCAAC GTGAAGAAAG TCAAATTACT AAAATTCATC AAGCTATTGC GATGATTCAA 
TTCAAGTTAG AAATACCAAT TATTAAACGT CGTCCAAATT TCGAAATGGA AGAACGTCTT 
GTGCTTGAAA AGGTTAATTA TGATACAAAT GAAATTACAG TTTATGGTAA TACATACCGA 
TTGAAAGACA CATGTTTCCA AACTGTCAAT CGTGATAATC CAGCAGAATT ACTACCTGAA 
GAAGAAGAAG TCATGAATAA ACTATTATTG TCATTCCAAC AATCTGAAAA ATTACGTCGT 
CATATGTCrr TCTTGATGCG TAAAGGCTCT CTTTACTTAC CATATAATGG CAATTTACTC 
ATTCATGGTT GTATTCCAGT TGATGAAAAT GGTGAGATGG AATCATTTGA AATTGATGGT 
CATACTTACA GCGGCCAAGA ATTATTAGAT GTGTTTGAGT ATCATGTCCG TAAATCATTT 
GATGAAAAAG AAAATACTGA TGACTTATCG ACGGATTTAG TTTGGTATTT ATGGACTGGG 
AAATATTCGT CACTATTTGG TAAACGTGCC ATGACTACGT TTGAGCGATA CTTTATTGCA 
GATAAAGCTT CTCATAAAGA AGAAAAGAAT CCGTACTATC aTCTTCGTGA AGATGTGaAT 
ATGGkTCGTA AAATGCTCaG TGaTTTCGGA TTAAATCCAG ATGAAGGACG CATTATTAAT 
GGTCACACAC CAGTGAAAGA AATCAATGGC GAGATCCTAT CAAGGCTGAT GGAAAGA 
(2) INFORMATION FOR SEQ ID NO: 720: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4 00 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 720: 
TGAGCACATG ACAGTGGCTG AAAACATTAA ATTTTTTAAA TCACTTTGTA AAAATCCAAT 
TAACGATACA ACTATCAACG AATATTTACA GCAATTAAAC TTTGATGATA CGTCTGCCAA 
AGTATCTACA TTGTCCGGTG GGAATAAACG TAAAATTAAT ATATTAGTAG GTTTACTAGG 
TCAACCTCGA ATTCTCATTT TAGATGAACC GACAGTTGGT ATTGATTTAA AATCTAGACA 
TGACATCCAC CAACTACTTA ACATCATGAA ATCTAAATGT TTAATTATAT TAACTACCCA 
TCATTTAGAT GAAGTTGAGG CACTTGCAGA TGGTTATCAA GTTAATTGGG CCAGGTnCCC 
TTTTnTTCAA CAGTTTTTGG GGGCCAACCA TGGGCTTATA 
(2) INFORMATION FOR SEQ ID NO: 721: 
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(A) LENGTH: 570 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 721: 

10 CTTATTTATA TTATAATATA AATATTTTAT TTTTCAATAC TTAATTTTAA AAATCCCCTA 60 

TGAAAATGTT GATGAGCTAC ATCTTTAAAT CTTATTATAC ATTGTATAAA ATTATATTGC 120 

GAGGTAGTAA ATTGATATTA TACACTTTTG GTTGTGTATG CATCTCACCT ATCTTTTTTG 180 

IS CTTTTTTCAA ATAAGAAAGT ATTAAAAATy AATGCCTATA CAGGAACAGA CATGGCTAAA 240 

CTTGATTTAA ATAGTCTTGA CGACGAGCAC GTAAAATTAT TAATAAATGA ATTAAAATAT 300 

CCAGAAACTC ATATCGATGT AAATGAATTA AAAACAATAG TTGCTAGTCG AATAAATGAA 360 

20 

AGGCAAGAAA TAATAAGTTT TAAGTTAGGA ATAAAGTACT TATTAACAAT AAAAAGAGGG 420 

AACATAGAAA AAGATAGGTT TTCAATTTCA ATCATTTTCA AAGATACCTA TCACACCCTA 480 

GTTAGAATAG ATATTAACGG TGGTACTCAC GATAATCCAG ATGGAACAAT CGCTCCGAAA 540 

25 

AGTCATATTC ACATATATAA TGATAAGTAT 570 
(2) INFORMATION FOR SEQ ID NO: 722: 

30 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 400 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 
<D) TOPOLOGY: linear 

35 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 722: 
ATTTTAGTCT TAGGTGTTGA TTGCATGATG AATGCAGAAG TTATACCTGC AGCCATATTA 60 

40 

GCACCTTCAT TATTGTGTAT AATTTGAATA TTATTTGCTT TTAAAGTATG TCCAATTAAG 120 
TTTGAAGTCG TTGTTTTACC ATTTGTTCCA CTGATAAATA CAATATCATC AACTTGCTCT 180 
GCTAATTTTC TTAATATATC TGTATCCACT TTTCTAGCGA TTTGTCCAGG TAAATCTGTT 240 

45 

CCTCTTTTAC CTACTGCTCT ACTTGCTTTA CGCGCCAATT TCGCTAGATG GATTGCCGTC 300 

CACTGTCTCA TGTGTTTCCT CCtCAAATTt CCACTCGCAT CATTATAACA TGACAAGGCA 360 

SO ACTTCAAAAA AGTTTCTCAA TCACAAATnG ATACGAGTGT . 400 

(2) INFORMATION FOR SEQ ID NO: 723 : 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1113 base pairs 
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(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 723: 

GATTATATGC TGTTGGCAAA ACAATATACC CAGATGAATT TTTATTTrTA GTAATAGTAT 60 

AACCATGCTT TGTCTTACTA ACTTTGACAG CTTCTAATGA ATTTGAAGCG TCTTTAAGCG 120 

TGGTATAATC TTCGCCGTAT ATCCCTTTTA AATTTACTCG ATACTTACCT TTAGGCAATG 180 

ATAATCTAAT TCTATCTGGA GCTTTAATGC GTATOGTTAC GGGTGTTACA ACGCGTCGAT 240 

75 ATTTATAAGT GAGTTTATTT CTTTCTTGTG TATATTCATT CACTTTAACA TCATGAGCTT 300 

TATCCGGCGA AAGTAATTCT AAATCCATTT CAAAATACAA ATCTTTAAAT TGATTAGAAA 360 

CTGATTTTGG CAACTGTACA GTTAGACCAC CATTATTTTG TTTAACTTGT AATAAATGTT 420 

TTGTAGGAGA TTGCCAGGCT GCACTATTTA ATTTAATTGT TGAATCTGAT AGTAAATTTT 480 

TATTGGCTTT AAAATGTGTA TTAACATCTT TAATATTGTT AGAAACAATC CCTTGCAACA 540 

TTGCTTGTTC TTTATCTAAT GGAGATTTTA ATTCTTTATT GGAAAAGACC TTATTTGTAA 600 

TATGTGCACT TGGATAATGG ATGGTATTTT TAGAATGAAT CCAACGAACT TTATTGTCTT 660 

TGTGTTCAGA CTTAATTTTA AATCCATATG GtAAGTTGTC ATCATGATtC ACTCTAATTC 720 

GATCATTAAC ATTCCAAAGT GATAGTaAAT TTgACGATgC CAAGTAATCT ATAAGTGCTG 780 

TTTTTATCGA TTGGCATATT AATTTGGAGT GTCTTGTCAT AATATTTTAA AATGTCTCCA 84 0 

TTAAAAATAC TAGAATATAA TGAAATGCCA TTATAATGAT ATATAAATGG TGAATTTAAT 900 

35 GCATAGTCTG ACATATAATC AATGCGATTA AATGAGCCTG TTGCATTTTG ATTTATCTTT 960 

TTTATAAGCT GGTTTACATA GTTACTATGG TAATCATGTT GTTTCAACGT TGATAATGAT 1020 

TGTTGATAAG GTTTGATTGC CATGTTTTTG TTGTTATCTA AAATGACGAT TTGTTGAATC 1080 

ATaACGATTA ATACTAATAT TGCAACGGTT AAT 1113 
(2) INFORMATION FOR SEQ ID NO: 724: 
(i) SEQUENCE CHARACTERISTICS: 

(A} LENGTH: 464 base pairs 

(BI TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

so 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 724: 

TGCCGTTTAG CAAAATCTAG TATCGCTTGA TGATCAGATT CTGAAATTTC AGTGTGTACT 60 

55 
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GATTGATTAA GTTTATATGC AAGTGCATGT TCTCGTCCAC CAGCACCAAT TACTAATACA 180 

TTCATTTATG TTACGCCCCT TTAAAATTAG TGTTTAAAAT GTCGAGTGCC TGTGACTACC 240 

^ ATTGCAATAC CATGTTTATT AGCCATATCA ATTGAATCTT GATCTTTAAT CGAACCACCC 300 

GGTTGGATAA TTGCCTTTAT ACCATGTTGT GCTGCAAGTT CAACTGTATC TCCCATAGGG 3 SO 

AAAAATCCAT CAGATACTAA CGgCTACATG ATCATTGATT TCAATAGCTC TCTCTAACGC 420 

10 

AATTTTAGCA GCACCGACAC GATTCATTGG CCAGCAnCTA TACC 464 

(2} INFORMATION FOR SEQ ID NO: 725; 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1440 base pairs 
<B) TYPE: nucleic acid 
(C) STSANDEDNESS : double 
<D) TOPOLOGY: linear 

20 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 72S : 
GTTAAATnCA nTATTTnAAA TaTATTACCT TATTAGAAAA AGTCGTAATA TGAGGTGTAC 60 
2S AAATGACGCA AATTTTAATA GTAGAAGATG AACAAAACTT AGCAAGATTT CTTGAATTGG 120 
AACTCACACA TGAAAATTAC AATGTGGACA CAGAGTATGA TGGACAAGAC GGTTTAGATA 180 
AAGCGCTTAG CCATTACTAT GATTTAATCA TATTAGATTT AATGTTGCCG TCAATTAATG 24 0 

30 

GCTTAGAAAT TTGTCGCAAA ATTAGACAAC AACAATCTAC ACCTATCATT ATAATTACAG 300 
CGAAAAGTGA TACGTATGAC AAAGTTGCTG GGCTTGATTA CGGTGCAGAC GATTATATAG 360 
TTAAGCCGTT TGATATTGAA GAACTTTTAG CAAGAATTCG TGCAATTTTA CGTCGTCAGC 420 

35 

CACAAAAGGA TATTATCGAT GTCAACGGTA TTACAATTGA TAAGAACGCT TTTAAAGTGA 480 
CGGTAAATGG CGCAGAAATT GAaTTAACAA AAACAGAGTA TGATTTACTA TATCTTCTAG 54 0 

CTGAAAATAA AAACCATGTT ATGCAACGGG AACAAATTTT AAATCATGTA TGGGGTTATA 600 

40 

ATAGTGAAGT AGAAACAAAT GTCGTAGATG TTTATATAAG rTATTTACGA AACAAGTTAA 660 
AACCATACGA TCGTGACAAA ATGATTGAAA CAGTTCGTGG CGTTGGGTAT GTGATACGAT 720 
45 GACAAAACGT AAATTGCGCA ATAACTGGAT TATTGTTACC ACGATGATTA CGTTTGTCAC 780 
GATATTTTTG TTTTGTTTAA TTATTATTTT TTTCTTGAAA GATACACTGC ATAATAGTGA 840 
GCTTGATGAT GCaGAACGAA GCTCaAGCGA TATTAATAAt TTATTTCaTT CTAAgCCTGT 900 
TAAAgATATA TCTGCaTTAG ACTTGAATGC aTCTTTAgGT AAtTTTCaAG AGATAATTAT 960 
TTATGATGAG CATAATAATA AATTATTTGA GACATCGAAT GATAACACAG TGAGAGTTGA 1020 

55 
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ATATTTAATT ATTAAAGAAC CAATTACAAC GCAAGATTTC AAAGGGTATA GCTTGTTAAT 1140 

TCATTCACTA GAAAATTATG ATAACATCGT AAAATCATTG TATATCATTG CGCTGGCATT 1200 

^ TX3GAGTGATT GCAACAATTA TAACTGCCAC AATCAGTTAT GTATTTTCAA CACAAATTAC 1260 

TAAACCGCTT GTCAGTTTAT CAAATAAAAT GATTGAGATT CGACGAGATG GTTTTCAAAA 1320 

TAAATTGCAA TTAAATACAA ATTATGAAGA AATAGATAAT TTAGCAAATA CGTTTAATGA 1380 

10 

GATGATGAGC CAAATTGAAG AATCATTTAA TCAACAAAGA CAATTTGTTG AAGATGCGTC 1440 
(2) INFORMATION FOR SEQ ID NO: 726: 

(i) SEQUSNCE CHARACTERISTICS: 

(A) LENGTH: 375 base pairs 

(B) TYPE: nucleic acid 

(C) STRAOTEDNESS : double 

(D) TOPOLOGY: linear 

20 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 726: 



TGATATTCCG ACTTGCGAGG ATTATTGCGC ATTAAGGATT AACGCAGTAT GAGTCCAAAG 60 

ACGCGCGACA CCTGGAAAAA GGATTACCTA ATGCCTTATT TACAGTAACC TTGTATGATA 120 

AAGATCGGTT AATTGGTATG GGTAGAGTGA TTGGCGATGG CGGAACTGTT TTTCAAATTG 180 

TTGATATTGC AGTTTTGAAA AGTTACCAAG GTCAAGGTTA CGGCATCTAA TTATGGAGCA 240 

TATTATGCAA TATATTAAAG GTGTGGCTGT TGAGAGTACA TACGTTATCT GATTGGCAGA 300 

CTACCCAGCG GGnTAAATTA TATACCAAAT TTGGGTTTtlA TACCTACCGA ACCAGAnTCC 360 

AGGCGGTGAT GTATG 375 



35 

(2) INFORMATION FOR SEQ ID NO: 727: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 471 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

<D) TOPOLOGY: linear 



45 (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 727: 

TAAAAAACTT AGAGATGAAA ATCATATTAT TTATCTGTTT TTGGGACAAT TTTTTACTAA 60 

AAATGAAGAT CCATGGCATC AAATACTTAA TGATTTAGAA GTTACAAATT CTGTTGATAA 120 

SO 

TTTTTTAAGG TCAATAAGTA ATAAGGCCAA AGAAACAAAA AAAAGAGCTT TTATTATTAT 180 

TGATGCGCTT AATGAAGGTG AAGGTAAAAG GTTATGGGGA AATTATTTTC AAAGCTTTAT 240 
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AGATG1TATA TTACCCAAAA ACGCAATACA AGATAACAAT ATTGTAGTAT TTCAGCATGA ' 3 so 

AGGTTTTAGT AAGGAAGAAA ACTATAATCC AATTGTATCT TTTTGTGATT TTTATGGATT 420 

5 

AGAGCTACCT AAGTTACCTA TATTAAATCC AGAATTCAAC AATCCATTAT T 471 

(2) INFORMATION FOR SEQ ID NO: 728: 

(i) SEQUENCE CHARACTERISTICS: 
10 (A) LENGTH: 1750 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 
<D) TOPOLOGY: linear 



15 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 728: 
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ACAACACCTA 


ATTGCTTAGG 


120 




AGAATTTATA 








ill AA i L. A 
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Tl'TTTCTTGA 
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TTCTTCCATT 


TCACTTAAAA 


TCTTAGCTAG 
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30 


AATAGAAGCA 


ACATATGGAT 


TTAAAACATC 


ATCTTCAGGT 


ACCTTAAATT 


TCTTACCTTT 


420 


TCCATATATA 


CTCACATCGT 


CTTTCACAAA 


ACTTTGACCG 


TACAATGAAA 


CAACTGATTG 


480 




AACATCACTA 


ATCGTACGAG 


ATGGATCAAT 


TATATAACTG 


GCCAACATAA 


TATCGAAAGA 


540 


35 


AATATTTTGA 


ATATCAATCC 


CCAATCTATG 


TGATGCTACA 


TATGTTTTTT 


TAGCATCATA 


600 




TACGACTTTT 


TTCGAATTCG 


GATTTTCTAA 


CCATGAAACT 


AGTTCGACAT 


AATTATTTAT 


6G0 




GTCATCCGCA 


TTAATTACAA 


TATGTTTCTC 


ACCTGtAAAT 


aAAGAGAATT 


TTAAAAtATT 


720 


40 


ATTtCGCAAA 


TAGtTACCAC 


CGtCTAATTC 


GAAATGGATG 


GCCGCTTCTT 


TcAATGAAGT 


780 




AAAATCcAAT 


ATTATCAAAA 


GACGTTTCcA 


ATTTCAAATG 


TCTTtTCTAT 


TGCATCTTCA 


840 




ACGcTtGCTG 


ATTGaTCAAT 


GTCAGCCAAC 


AATTGTTTGA 


ATTCTAACTT 


CTTAAACAAT 


900 


45 


TCGATTTTTT 


CTTGTTGTTC 


ATCTtGAkGA 


GTCATTAACG 


TATCTTCaAG 


TTTTACTTCa 


960 




ATCGGACTAT 


CTACATTAAt 


CGTTGCTAAT 


TCTTTACTCA 


TTAATGCATC 


TTCTTTGCTA 


1020 


SO 


TTTTGAAGTT 


TTTCTTTTAA 


CTTTTTACCT 


GAAATTTCAT 


CTAAATGTTC 


ATAGACACCT 


1080 


TCTACTGTGT 


CAAATTGGTT 


TAGCAA'ITTT 


ATTGCTGTTT 


TCTCTCCAAC 


ACCTGCAACA 


1140 




CCTGGTATAT 


TATCAGAAGT 


ATCTCCCATT 


AATCCTTTCA 


TATCAATAAT 


TTGATTAGGT 


1200 
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